L'objectif de cet ouvrage pédagogique est de fournir aux étudiants de cycles licences, masters et ingénieurs, des outils de bases en analyse de données et apprentissage automatique. Il est composé de 13 chapitres. Les cinq premiers s'articulent sur le pré-traitement, l'analyse en composante principale et multiple, ainsi que sur l'analyse factorielle des correspondances et discriminante des données. Tandis que les huit autres chapitres abordent la notion d'apprentissage dans les cas supervisé et non supervisé, afin de pouvoir traiter les problèmes de régression, classification et prédiction. Cela concerne essentiellement les algorithmes : Régression linéaire, polynomiale et logistique, la classification naïve bayésienne, les arbres de décision (DT), les forêts aléatoires (RF), les K-plus proches voisins (KNN), les machines à support de vecteurs (SVM), les K-means, DBSCAN et la classification hiérarchique.