Il riconoscimento delle emozioni umane è una componente cruciale dell'interazione uomo-computer (HCI), poiché le emozioni sono spesso trasmesse attraverso le espressioni facciali, il linguaggio del corpo e il parlato. Tra questi, il riconoscimento delle emozioni basato sul parlato spicca per la sua semplicità, il basso costo e la riduzione dei problemi di privacy. Il riconoscimento vocale delle emozioni (Speech Emotion Recognition, SER) prevede la categorizzazione di emozioni come neutralità, tristezza, paura, rabbia, sorpresa, disgusto e felicità utilizzando i segnali vocali. Questo libro esplora innovativi algoritmi di Deep Learning progettati per identificare e classificare accuratamente gli stati emotivi umani sulla base dei modelli vocali.