È una disciplina che combina tecniche di Intelligenza Artificiale, Apprendimento Computazionale, Probabilità, Statistica e Basi di Dati per estrarre informazioni e conoscenze utili da grandi quantità di dati; è una tecnica in continua evoluzione, che si adatta a nuove esigenze e nuove sfide. Può essere definita come un processo analitico, progettato per esplorare grandi quantità di dati, con l'obiettivo di trovare relazioni tra diverse variabili, al fine di applicarle a nuovi set di dati.