eMail: info@crmnet.it
MENUMENU

Customer Relationship Management and Marketing

Logo isola che non c'è marketing & Numbers

Data mining

Il data mining è una tipica applicazione informatica (solitamente facente parte di un sistema esperto), usata per rintracciare (ed accorpare) dati significativi sepolti sotto una montagna di informazioni irrilevanti. Il termine inglese mining fa proprio riferimento al lavoro di estrazione che viene fatto nelle miniere.

Aiutami a far conoscere il nostro lavoro
big-data-data_mining-crmnet-it

Data mining: come rintracciare informazioni nascoste

Da Wikipedia

Il data mining è una tipica applicazione informatica (solitamente facente parte di un sistema esperto), usata per rintracciare (ed accorpare) dati significativi sepolti sotto una montagna di informazioni irrilevanti: i BIG DATA.

Il termine inglese mining fa proprio riferimento al lavoro di estrazione che viene fatto nelle miniere.

Concetti di base

La Statistica – il campo della matematica applicata connesso con l’analisi dei dati – può essere definita altrimenti come “estrazione di informazione utile da insiemi di dati”.

Il concetto di data mining è analogo. L’unica differenza è che questa recente disciplina ha a che fare con cospicui insiemi di dati.

In sostanza il data mining è l'”analisi matematica eseguita su database di grandi dimensioni”. Il termine data mining è diventato popolare nei tardi anni ’90 come versione abbreviata della definizione appena esposta.

La Statistica – il campo della matematica applicata connesso con l’analisi dei dati – può essere definita altrimenti come “estrazione di informazione utile da insiemi di dati”.

Il concetto di data mining è analogo. L’unica differenza è che questa recente disciplina ha a che fare con cospicui insiemi di dati.

In sostanza il data mining è l'”analisi matematica eseguita su database di grandi dimensioni”. Il termine data mining è diventato popolare nei tardi anni ’90 come versione abbreviata della definizione appena esposta.

Oggi il data mining (letteralmente: estrazione di dati) ha una duplice valenza:

  • Estrazione, con tecniche analitiche all’avanguardia, di informazione implicita, nascosta, da dati già strutturati, per renderla disponibile e direttamente utilizzabile;
  • Esplorazione ed analisi, eseguita in modo automatico o semiautomatico, su grandi quantità di dati allo scopo di scoprire pattern (schemi) significativi.

In entrambi i casi i concetti di informazione e di significato sono legati strettamente al dominio applicativo in cui si esegue data mining, in altre parole un dato può essere interessante o trascurabile a seconda del tipo di applicazione in cui si vuole operare.

Questo tipo di attività è cruciale in molti ambiti della ricerca scientifica, ma anche in altri settori (per esempio in quello delle ricerche di mercato).

Nel mondo professionale è utilizzata per risolvere problematiche diverse tra loro, che vanno dalla gestione delle relazioni con i clienti (CRM), all’individuazione di comportamenti fraudolenti per finire all’ottimizzazione di siti web.
Oggi il data mining (letteralmente: estrazione di dati) ha una duplice valenza:

  • Estrazione, con tecniche analitiche all’avanguardia, di informazione implicita, nascosta, da dati già strutturati, per renderla disponibile e direttamente utilizzabile;
  • Esplorazione ed analisi, eseguita in modo automatico o semiautomatico, su grandi quantità di dati allo scopo di scoprire pattern (schemi) significativi.

In entrambi i casi i concetti di informazione e di significato sono legati strettamente al dominio applicativo in cui si esegue data mining, in altre parole un dato può essere interessante o trascurabile a seconda del tipo di applicazione in cui si vuole operare.

Questo tipo di attività è cruciale in molti ambiti della ricerca scientifica, ma anche in altri settori (per esempio in quello delle ricerche di mercato).

Nel mondo professionale è utilizzata per risolvere problematiche diverse tra loro, che vanno dalla gestione delle relazioni con i clienti (CRM), all’individuazione di comportamenti fraudolenti per finire all’ottimizzazione di siti web.

Esempi di utilizzo dei dati

Che cosa non è estrazione di dati?

  • Cercare un numero di telefono nell’elenco;
    Fare una ricerca in Internet su “vacanze alle Maldive”.

Che cosa è estrazione di dati?

  • Scoprire che alcuni cognomi (Benetton, Troncon, Cavasin) sono molto comuni in specifiche aree dell’Italia;
  • Fare una ricerca nel web su una parola chiave e classificare i documenti trovati secondo un criterio semantico (p. es. “corriere”: nome di giornale, professione, ecc.)

Il data mining nella ricerca scientifica

I fattori principali che hanno contribuito allo sviluppo del data mining sono:

* le grandi accumulazioni di dati in formato elettronico,
* il data storage poco costoso, e
* i nuovi metodi e tecniche di analisi (apprendimento automatico, riconoscimento di pattern).

Le tecniche di data mining sono fondate su specifici algoritmi.

I pattern identificati possono essere, a loro volta, il punto di partenza per ipotizzare e quindi verificare nuove relazioni di tipo causale fra fenomeni;

in generale, possono servire in senso statistico per formulare previsioni su nuovi insiemi di dati.

Un concetto correlato al data mining è quello di apprendimento automatico (Machine learning);

infatti, l’identificazione di pattern può paragonarsi all’apprendimento, da parte del sistema di data mining, di una relazione causale precedentemente ignota, cosa che trova applicazione in ambiti come quello degli algoritmi euristici e della intelligenza artificiale.

Tuttavia, occorre notare che il processo di data mining è sempre sottoposto al rischio di rivelare relazioni causali che poi si rivelano inesistenti.

Tra le tecniche maggiormente utilizzate in questo ambito vi sono:

* Clustering;
* Reti neurali;
* Alberi di decisione;
* Analisi delle associazioni (individuazione dei prodotti acquistati congiuntamente).

Un’altra tecnica molto diffusa per il data mining è l’apprendimento mediante classificazione.

Questo schema di apprendimento parte da un insieme ben definito di esempi di classificazione per casi noti, dai quali ci si aspetta di dedurre un modo per classificare esempi non noti.

Tale approccio viene anche detto con supervisione (supervised), nel senso che lo schema di apprendimento opera sotto la supervisione fornita implicitamente dagli esempi di classificazione per i casi noti;

tali esempi, per questo motivo, vengono anche detti training examples, ovvero esempi per l’addestramento.

La conoscenza acquisita per apprendimento mediante classificazione può essere rappresentata con un albero di decisione.

L’estrazione dei dati vera e propria giunge quindi al termine di un processo che comporta numerose fasi: si individuano le fonti di dati;

si crea un unico set di dati aggregati;

si effettua una pre-elaborazione (data cleaning, analisi esplorative, selezione, ecc.);

si estraggono i dati con l’algoritmo scelto;

si interpretano e valutano i pattern;

l’ultimo passaggio va dai pattern alla nuova conoscenza così acquisita.

Il data mining nella ricerca di mercato

L’utilizzo del data mining nella ricerca di mercato è volto ad ampliare la conoscenza su cui basare i processi decisionali.

Nel contesto aziendale il data mining è considerato parte del processo che porta alla creazione di un data warehouse. È efficace soprattutto per la valorizzazione delle informazioni aziendali residenti in questi grandi depositi di dati.

Affinché l’informazione estratta dai dati esistenti sia significativa, e quindi potenzialmente utile, deve essere:

* valida (cioè può agire anche sui nuovi dati);
* precedentemente sconosciuta;
* comprensibile.

In questo contesto, un pattern (schema) non è altro che la rappresentazione delle relazioni chiave che vengono scoperte durante il processo di estrazione dati:

sequenze ripetute, omogeneità, emergenza di regole, ecc.

Per esempio, se un pattern mostra che i clienti di una certa area demografica sono molto propensi ad acquistare uno specifico prodotto, allora un’interrogazione (query) selettiva ad un data warehouse di probabili compratori può essere usata per generare un elenco di indirizzi promozionali.

ultima modifica: 2017-11-01T16:30:04+00:00 da Riccardo Grassi

Related articles

web-reputation-crmnet-social-media-marketing-web

Prima della web reputation

Web Reputation Conoscere quello che internet dice di te
Molti parlano di web reputation, di quanto sia utile, di quanto sia importante, di come sia fondamentale per capire se e come parlano di te in rete.

Aiutami a far conoscere il nostro lavoro

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *