Cet ouvrage représente un premier pas vers l'apprentissage automatique embarqué. Il présente les techniques d'optimisation et de compression des modèles d'apprentissage profond. Ces techniques permettent de faciliter le déploiement d'un modèle deep learning performant et léger sur des équipements à ressources limitées comme les smartphones et les micro-contrôleurs. Ce document explore également une technique de transfert de connaissances d'actualité, à savoir la distillation de connaissances. Cette technique permet d'améliorer les performances d'un modèle deep learning léger, tout en lui transférant les connaissances d'un modèle deep learning complexe et performant. Toutes ces techniques ont été détaillées dans ce livre et illustrées par des implémentations Python pratiques, basées généralement sur l'utilisation des librairies pytorch et tensorflow.