32,99 €
inkl. MwSt.
Versandkostenfrei*
Versandfertig in 6-10 Tagen
payback
16 °P sammeln
  • Broschiertes Buch

La diarizzazione degli altoparlanti è il processo che rileva gli altoparlanti attivi e raggruppa i segnali vocali emessi dallo stesso altoparlante. Generalmente possiamo trovare due applicazioni principali per la diarizzazione degli altoparlanti. I sistemi di riconoscimento automatico del parlato utilizzano i cluster omogenei dell'altoparlante per adattare i modelli acustici in modo che siano dipendenti dall'altoparlante e quindi aumentino le prestazioni di riconoscimento. I sistemi di indicizzazione degli altoparlanti e i sistemi di trascrizione ricca utilizzano anche l'uscita della…mehr

Produktbeschreibung
La diarizzazione degli altoparlanti è il processo che rileva gli altoparlanti attivi e raggruppa i segnali vocali emessi dallo stesso altoparlante. Generalmente possiamo trovare due applicazioni principali per la diarizzazione degli altoparlanti. I sistemi di riconoscimento automatico del parlato utilizzano i cluster omogenei dell'altoparlante per adattare i modelli acustici in modo che siano dipendenti dall'altoparlante e quindi aumentino le prestazioni di riconoscimento. I sistemi di indicizzazione degli altoparlanti e i sistemi di trascrizione ricca utilizzano anche l'uscita della diarizzazione degli altoparlanti come una delle informazioni estratte da una registrazione, che permettono la sua indicizzazione automatica e altre ulteriori elaborazioni. In questo studio viene sviluppata un'applicazione per la diarizzazione degli altoparlanti - utilizzando registrazioni del parlato binaurale multipartito - per tracciare l'attività degli altoparlanti sulla base dei segnali di differenza temporale interaurale (ITD). Questi cues, per un dato frame di segnale vocale, sono calcolati utilizzando il filtraggio del gammatone e la tecnica di cross-correlazione. I loro valori sono utilizzati per determinare quale altoparlante nella registrazione produce il frammento di parlato considerato. Questo studio è stato supervisionato dal Dr. Jon Barker, e difeso per soddisfare i requisiti del Master in Advanced Computer Science, Università di Sheffield, Regno Unito, 2007.
Autorenporträt
Maral Dadvar trabaja en el Grupo de Interacción con los Medios Humanos de la Universidad de Twente, en los Países Bajos, como investigador de doctorado. Desarrolló un interés en el procesamiento del lenguaje natural cuando implementó la diarización del hablante para su tesis de maestría. Maral tiene una maestría en ciencias informáticas avanzadas de la Universidad de Sheffield, Reino Unido.