L'apprentissage supervisé décrit un scénario dans lequel l'expérience devient un facteur de formation, qui contient des informations importantes (par exemple, les étiquettes "malade/sain" pour la détection des maladies des plantes) qui sont absentes des "exemples de test" non vus auxquels l'expertise apprise sera appliquée. Dans ce scénario, l'expertise acquise vise à prédire cette information manquante pour les données de test. En ce sens, l'environnement peut être considéré comme un enseignant qui supervise l'apprenant en lui fournissant des informations supplémentaires sous forme d'étiquettes. Dans ce livre, nous aborderons les modèles d'apprentissage automatique supervisé, à travers lesquels vous comprendrez les fondements théoriques, quelques descriptions de domaines d'application, puis vous mettrez en oeuvre chacun d'entre eux dans le laboratoire Jupyter avec les bibliothèques pandas et scikit-learn pour Python. Dans un premier temps, vous commencerez par la régression logistique (classification binaire), la classification multi-classes par régression logistique, les arbres de décision, la machine à vecteur de support - SVM (Support Vector Machines), Random Forest, la validation croisée K-Fold et, enfin, la validation naïve.