La reconnaissance des émotions humaines est un élément essentiel de l'interaction homme-machine (IHM), car les émotions sont souvent transmises par les expressions faciales, le langage corporel et la parole. Parmi ces derniers, la reconnaissance des émotions par la parole se distingue par sa simplicité, son faible coût et la réduction des problèmes de protection de la vie privée. La reconnaissance des émotions par la parole (SER) consiste à catégoriser des émotions telles que la neutralité, la tristesse, la peur, la colère, la surprise, le dégoût et le bonheur à l'aide de signaux vocaux. Ce livre explore les algorithmes innovants de Deep Learning conçus pour identifier et classer avec précision les états émotionnels humains sur la base de modèles vocaux.