La maggior parte delle aziende dispone di enormi basi dati che costituiscono una potenziale miniera di informazioni molto utili. Il data mining aiuta a leggere, comprendere e sfruttare questi dati. Queste tecniche fanno emergere le tendenze, le relazioni tra i dati, le ragioni legate al manifestarsi dei fenomeni. Quindi, evidenziano non solo cosa sta accadendo, ma anche perchè.
2010: VALUE LAB vince 2 Premi ICT Innovazione nella categoria Business Intelligence & Business Analytics. Approfondimenti
Overview
Il data mining è un processo che mira a scoprire variabili nuove o implicite e le correlazioni di causa e effetto. E’ un processo interattivo che consiste nell’esplorazione di correlazioni, modelli e tendenze significative che si manifestano tra i dati presenti in ampi database (generalmente creati integrando fonti interne ed esterne), utilizzando tecniche statistiche e algoritmi matematici.
Data mining significa ”scavare” nei dati per trasformare il patrimonio di informazioni in indicazioni strategiche.
Le numerose tecniche impiegate nel data mining possono essere ricondotte a cinque aree di applicazione:
- previsione – utilizzo di valori noti per la previsione di quantità non note (es. stima del fatturato di un punto vendita sulla base delle sue caratteristiche)
- classificazione -individuazione delle caratteristiche che indicano a quale gruppo un certo caso appartiene (es. discriminazione tra comportamenti ordinari e fraudolenti)
- segmentazione – individuazione di gruppi con elementi omogenei all’interno del gruppo e diversi da gruppo a gruppo (es. individuazione di gruppi di consumatori con comportamenti simili)
- associazione – individuazione di elementi che compaiono spesso assieme in un determinato evento (es. prodotti che frequentemente entrano nello stesso carrello della spesa)
- sequenze – individuazione di una cronologia di associazioni (es. percorsi di visita di un sito web)
-
-
Applicazioni dei modelli di data mining
Software e Dati
Le componenti del Data Mining, oltre alle imprescindibili competenze di business e di statistica, sono i Software statistici e i dati di fonte interna ed esterna.
Software statistici
VALUE LAB realizza le analisi di data mining utilizzando i più importanti tool disponibili:
- Enterprise Miner (SAS)
- Data Visualization (SAS)
- Forecast Server (SAS)
- Statistics (SAS)
approfondisci
Dati di fonte esterna
approfondisci
Ricerche
- ricerche di mercato
- rilevazioni field
- osservatori
approfondisci
Trattamento Dati di fonte interna ed esterna
- Riconoscimento
- Normalizzazione
- Matching
- Deduplica
- Geocodifica e georeferenziazione
approfondisci
-
-
Le componenti dal data mining
Applicazioni
- Stimare il fatturato potenziale di un nuovo punto vendita
- Stimare il bacino di utenza di un nuovo punto vendita
- Individuare i clienti potenziali più interessanti
- Individuare i brand con un maggior grado di concorrenzialità/sostituibilità con una determinata marca
- Individuare le tipologie di prodotti percepiti come sostitutivi dell’offerta di una determinata azienda
Prodotto
- Ottimizzare le politiche di sconto
- Valutare l’ampiezza di utilizzo di una gamma di prodotti da parte del cliente
- Stimare il valore di un immobile
- Definire i contenuti di un prodotto / servizio
- Scoring promozionale: per identificare i migliori gruppi target per azioni promozionali
- Cross-selling: per individuare le possibilità di vendita incrociata / incrementale
- Definire i contenuti di pacchetti promozionali
- Individuare le promozioni più efficaci
- Selezionare nominativi per azioni di direct marketing
- Segmentare la clientela: per individuare nei dati raggruppamenti omogenei sulla base del comportamento d’acquisto, delle caratteristiche socio-demografiche o territoriali e differenziare le iniziative di marketing
- Caratterizzare i migliori clienti attuali / potenziali
- Churn analysis: per identificare i clienti a rischio di abbandono
- Studiare il comportamento d’acquisto dei propri clienti
- Life time value
Rischio
- Credit scoring: per valutare la solvibilità dell’individuo e quindi l’affidabilità creditizia
- Fraud detection: per identificare le frodi e i comportamenti illegittimi
Web
- Analizzare le dinamiche di visita del sito
- Analizzare le dinamiche di acquisto
Tecniche
VALUE LAB realizza le analisi di data mining utilizzando le tecniche più avanzate:
- alberi decisionali
- reti neurali
- regressione logistica
- cluster analisys
- basket analysis
- sequence analysis
- nearest neighbour
-
-
Cluster Analysis: comportamenti d'acquisto del Cluster A tra i clienti di un supermercato
Metodologia
La Metodologia CRISP-DM (Cross Industry Standard Process for Data Mining) è un approccio standard alle analisi di data mining che risponde ai seguenti requisiti:
- Fornire una struttura per il processo di Data Mining indipendente dalla tipologia di business
- Fornire una guida ai potenziali problemi e alle loro soluzioni
-
-
Le fasi della metodologia CRISP-DM. Fonte: www.crisp-dm.org
Descrizione sintetica delle singole fasi della metodologia CRISP-DM:
1. COMPRENSIONE DEL BUSINESS
- Determinazione degli obiettivi di business
- Valutazione della situazione
- Determinazione degli obiettivi del Data Mining
- Produzione del piano di progetto
2. COMPRENSIONE DEI DATI
- Raccolta dei dati iniziali – Report sulla raccolta dei dati iniziali
- Descrizione dei dati – Report sulla descrizione dei dati
- Esplorazione dei dati – Report sulla esplorazione dei dati
- Verifica della qualità dei dati – Report sulla qualità dei dati
3. PREPARAZIONE DEI DATI
- Base dati- Descrizione della base dati
- Selezione dei dati – Criteri per inclusione/esclusione
- Pulizia dati – Report sulla pulizia dati
- Costruzione di dati – Attributi derivati, Record generati
- Integrazione dati – Dati uniti
- Impostazione dati – Dati reimpostati
4. MODELLIZZAZIONE
- Scelta della tecnica di modellizzazione
- Generazione di progetto di test
- Costruzione del modello
- Valutazione del modello – Reimpostazione dei parametri
5. VALUTAZIONE
- Valutazione dei risultati
- Revisione del processo
- Determinazione dei passi successivi
6. UTILIZZO
- Piano di utilizzo
- Piano di monitoraggio e mantenimento
- Produzione del report finale
- Recensione del progetto
Per maggiori informazioni scarica il materiale illustrativo
CRISP- DM: Step by step data mining guide