Analytics & Data Mining

La maggior parte delle aziende dispone di enormi basi dati che costituiscono una potenziale miniera di informazioni molto utili. Il data mining aiuta a leggere, comprendere e sfruttare questi dati. Queste tecniche fanno emergere le tendenze, le relazioni tra i dati, le ragioni legate al manifestarsi dei fenomeni. Quindi, evidenziano non solo cosa sta accadendo, ma anche perchè.

2010: VALUE LAB vince 2 Premi ICT Innovazione nella categoria Business Intelligence & Business Analytics. Approfondimenti

Overview

Il data mining è un processo che mira a scoprire variabili nuove o implicite e le correlazioni di causa e effetto. E' un processo interattivo che consiste nell'esplorazione di correlazioni, modelli e tendenze significative che si manifestano tra i dati presenti in ampi database (generalmente creati integrando fonti interne ed esterne), utilizzando tecniche statistiche e algoritmi matematici.

Data mining significa "scavare" nei dati per trasformare il patrimonio di informazioni in indicazioni strategiche.

Le numerose tecniche impiegate nel data mining possono essere ricondotte a cinque aree di applicazione:

  • previsione - utilizzo di valori noti per la previsione di quantità non note (es. stima del fatturato di un punto vendita sulla base delle sue caratteristiche)
  • classificazione -individuazione delle caratteristiche che indicano a quale gruppo un certo caso appartiene (es. discriminazione tra comportamenti ordinari e fraudolenti)
  • segmentazione - individuazione di gruppi con elementi omogenei all'interno del gruppo e diversi da gruppo a gruppo (es. individuazione di gruppi di consumatori con comportamenti simili)
  • associazione - individuazione di elementi che compaiono spesso assieme in un determinato evento (es. prodotti che frequentemente entrano nello stesso carrello della spesa)
  • sequenze - individuazione di una cronologia di associazioni (es. percorsi di visita di un sito web)
Applicazioni dei modelli di Data mining
Applicazioni dei modelli di data mining

Software e Dati

Le componenti del Data Mining, oltre alle imprescindibili competenze di business e di statistica, sono i Software statistici e i dati di fonte interna ed esterna.

Software statistici

VALUE LAB realizza le analisi di data mining utilizzando i più importanti tool disponibili:

  • Enterprise Miner (SAS)
  • Data Visualization (SAS)
  • Forecast Server (SAS)
  • Statistics (SAS)

approfondisci

Dati di fonte esterna

  • liste e dati

approfondisci

Ricerche

  • ricerche di mercato
  • rilevazioni field
  • osservatori

approfondisci

Trattamento Dati di fonte interna ed esterna

  • Riconoscimento
  • Normalizzazione
  • Matching
  • Deduplica
  • Geocodifica e georeferenziazione

approfondisci

Le componenti dal data mining
Le componenti dal data mining


Applicazioni

Sviluppo del business

  • Stimare il fatturato potenziale di un nuovo punto vendita
  • Stimare il bacino di utenza di un nuovo punto vendita
  • Individuare i clienti potenziali più interessanti

Concorrenza

  • Individuare i brand con un maggior grado di concorrenzialità/sostituibilità con una determinata marca
  • Individuare le tipologie di prodotti percepiti come sostitutivi dell'offerta di una determinata azienda

Prodotto

  • Ottimizzare le politiche di sconto
  • Valutare l'ampiezza di utilizzo di una gamma di prodotti da parte del cliente
  • Stimare il valore di un immobile
  • Definire i contenuti di un prodotto / servizio

Promozioni

  • Scoring promozionale: per identificare i migliori gruppi target per azioni promozionali
  • Cross-selling: per individuare le possibilità di vendita incrociata / incrementale
  • Definire i contenuti di pacchetti promozionali
  • Individuare le promozioni più efficaci
  • Selezionare nominativi per azioni di direct marketing

CRM

  • Segmentare la clientela: per individuare nei dati raggruppamenti omogenei sulla base del comportamento d'acquisto, delle caratteristiche socio-demografiche o territoriali e differenziare le iniziative di marketing
  • Caratterizzare i migliori clienti attuali / potenziali
  • Churn analysis: per identificare i clienti a rischio di abbandono
  • Studiare il comportamento d'acquisto dei propri clienti
  • Life time value

Rischio

  • Credit scoring: per valutare la solvibilità dell'individuo e quindi l'affidabilità creditizia
  • Fraud detection: per identificare le frodi e i comportamenti illegittimi

Web

  • Analizzare le dinamiche di visita del sito
  • Analizzare le dinamiche di acquisto

Sentiment Analysis

  • Definire strategie di branding online (brand revival e riposizionamento su nuovi segmenti di clientela)
  • Valutare la reputazione del brand e analizzare il posizionamento all’interno dei social media
  • Identificare e monitorare trend e opinioni cogliendo opportunità di business

Tecniche

VALUE LAB realizza le analisi di data mining utilizzando le tecniche più avanzate:

  • alberi decisionali
  • reti neurali
  • regressione logistica
  • cluster analisys
  • basket analysis
  • sequence analysis
  • nearest neighbour
  • text mining
  • content categorization
  • ontology management
  • sentiment Analysis
Cluster Analysis: comportamenti d'acquisto del Cluster A tra i clienti di un supermercato
Cluster Analysis: comportamenti d'acquisto del Cluster A tra i clienti di un supermercato

Metodologia

La Metodologia CRISP-DM (Cross Industry Standard Process for Data Mining) è un approccio standard alle analisi di data mining che risponde ai seguenti requisiti:

  • Fornire una struttura per il processo di Data Mining indipendente dalla tipologia di business
  • Fornire una guida ai potenziali problemi e alle loro soluzioni
Le fasi della metodologia CRISP-DM
Le fasi della metodologia CRISP-DM. Fonte: www.crisp-dm.org


Descrizione sintetica delle singole fasi della metodologia CRISP-DM:

1. COMPRENSIONE DEL BUSINESS

  • Determinazione degli obiettivi di business
  • Valutazione della situazione
  • Determinazione degli obiettivi del Data Mining
  • Produzione del piano di progetto

2. COMPRENSIONE DEI DATI

  • Raccolta dei dati iniziali - Report sulla raccolta dei dati iniziali
  • Descrizione dei dati - Report sulla descrizione dei dati
  • Esplorazione dei dati - Report sulla esplorazione dei dati
  • Verifica della qualità dei dati - Report sulla qualità dei dati

3. PREPARAZIONE DEI DATI

  • Base dati- Descrizione della base dati
  • Selezione dei dati - Criteri per inclusione/esclusione
  • Pulizia dati - Report sulla pulizia dati
  • Costruzione di dati - Attributi derivati, Record generati
  • Integrazione dati - Dati uniti
  • Impostazione dati - Dati reimpostati

4. MODELLIZZAZIONE

  • Scelta della tecnica di modellizzazione
  • Generazione di progetto di test
  • Costruzione del modello
  • Valutazione del modello - Reimpostazione dei parametri

5. VALUTAZIONE

  • Valutazione dei risultati
  • Revisione del processo
  • Determinazione dei passi successivi

6. UTILIZZO

  • Piano di utilizzo
  • Piano di monitoraggio e mantenimento
  • Produzione del report finale
  • Recensione del progetto

Per maggiori informazioni scarica il materiale illustrativo

CRISP- DM: Step by step data mining guide

torna su