Es una disciplina que combina técnicas de Inteligencia Artificial, Aprendizaje Computacional, Probabilidad, Estadística, y Bases de Datos para extraer información y conocimientos útiles desde grandes cantidades de datos, es una técnica en constante evolución, que se adapta a las nuevas necesidades y a los nuevos desafíos. Se puede definir como un proceso analítico, diseñado para explorar grandes cantidades de datos, con el objetivo de encontrar relaciones entre las diferentes variables, para aplicarlas a nuevos conjuntos de datos.