La diarizzazione degli altoparlanti è il processo che rileva gli altoparlanti attivi e raggruppa i segnali vocali emessi dallo stesso altoparlante. Generalmente possiamo trovare due applicazioni principali per la diarizzazione degli altoparlanti. I sistemi di riconoscimento automatico del parlato utilizzano i cluster omogenei dell'altoparlante per adattare i modelli acustici in modo che siano dipendenti dall'altoparlante e quindi aumentino le prestazioni di riconoscimento. I sistemi di indicizzazione degli altoparlanti e i sistemi di trascrizione ricca utilizzano anche l'uscita della diarizzazione degli altoparlanti come una delle informazioni estratte da una registrazione, che permettono la sua indicizzazione automatica e altre ulteriori elaborazioni. In questo studio viene sviluppata un'applicazione per la diarizzazione degli altoparlanti - utilizzando registrazioni del parlato binaurale multipartito - per tracciare l'attività degli altoparlanti sulla base dei segnali di differenza temporale interaurale (ITD). Questi cues, per un dato frame di segnale vocale, sono calcolati utilizzando il filtraggio del gammatone e la tecnica di cross-correlazione. I loro valori sono utilizzati per determinare quale altoparlante nella registrazione produce il frammento di parlato considerato. Questo studio è stato supervisionato dal Dr. Jon Barker, e difeso per soddisfare i requisiti del Master in Advanced Computer Science, Università di Sheffield, Regno Unito, 2007.
Bitte wählen Sie Ihr Anliegen aus.
Rechnungen
Retourenschein anfordern
Bestellstatus
Storno