Chi ha parlato quando?

Stima della posizione degli altoparlanti basata sull'audio per la diarizzazione

Fotogalerie

Maral Dadvar

Chi ha parlato quando?

Stima della posizione degli altoparlanti basata sull'audio per la diarizzazione

Broschiertes Buch

Jetzt bewerten Jetzt bewerten

Autorenporträt

Andere Kunden interessierten sich auch für

Maral Dadvar
Quem falou quando?

34,99 €
Guo Ping Su
wei ha ke wen ruan jian kai fa mo shi ji guan jian ji shu de yan jiu

53,99 €
Ling Zhi Zhao
ji yu yun ji suan de zhi neng mei kuang jue ce zhi chi xi tong she ji yu shi xian

14,99 €
Roman Slonskyi
Applicazione dell'intelligenza artificiale al problema dell'ottimizzazione

31,99 €
Ahmed Gazali Mounirou
Rilevamento di immagini false mediante algoritmi di apprendimento automatico

43,99 €
Tolga Naziyok
2D Rennspiel mit Computergegnern

31,95 €
Charles Bell
Introducing InnoDB Cluster

47,99 €

Produktbeschreibung

La diarizzazione degli altoparlanti è il processo che rileva gli altoparlanti attivi e raggruppa i segnali vocali emessi dallo stesso altoparlante. Generalmente possiamo trovare due applicazioni principali per la diarizzazione degli altoparlanti. I sistemi di riconoscimento automatico del parlato utilizzano i cluster omogenei dell'altoparlante per adattare i modelli acustici in modo che siano dipendenti dall'altoparlante e quindi aumentino le prestazioni di riconoscimento. I sistemi di indicizzazione degli altoparlanti e i sistemi di trascrizione ricca utilizzano anche l'uscita della diarizzazione degli altoparlanti come una delle informazioni estratte da una registrazione, che permettono la sua indicizzazione automatica e altre ulteriori elaborazioni. In questo studio viene sviluppata un'applicazione per la diarizzazione degli altoparlanti - utilizzando registrazioni del parlato binaurale multipartito - per tracciare l'attività degli altoparlanti sulla base dei segnali di differenza temporale interaurale (ITD). Questi cues, per un dato frame di segnale vocale, sono calcolati utilizzando il filtraggio del gammatone e la tecnica di cross-correlazione. I loro valori sono utilizzati per determinare quale altoparlante nella registrazione produce il frammento di parlato considerato. Questo studio è stato supervisionato dal Dr. Jon Barker, e difeso per soddisfare i requisiti del Master in Advanced Computer Science, Università di Sheffield, Regno Unito, 2007.

Produktdetails

Produktdetails
Verlag: Edizioni Sapienza
Seitenzahl: 72
Erscheinungstermin: 2. Januar 2021
Italienisch
Abmessung: 220mm x 150mm x 5mm
Gewicht: 125g
ISBN-13: 9786203172348
ISBN-10: 6203172340
Artikelnr.: 60874838

Herstellerkennzeichnung
Books on Demand GmbH
In de Tarpen 42
22848 Norderstedt
info@bod.de
040 53433511

Produktdetails

Verlag: Edizioni Sapienza
Seitenzahl: 72
Erscheinungstermin: 2. Januar 2021
Italienisch
Abmessung: 220mm x 150mm x 5mm
Gewicht: 125g
ISBN-13: 9786203172348
ISBN-10: 6203172340
Artikelnr.: 60874838

Herstellerkennzeichnung
Books on Demand GmbH
In de Tarpen 42
22848 Norderstedt
info@bod.de
040 53433511

Autorenporträt

Maral Dadvar trabaja en el Grupo de Interacción con los Medios Humanos de la Universidad de Twente, en los Países Bajos, como investigador de doctorado. Desarrolló un interés en el procesamiento del lenguaje natural cuando implementó la diarización del hablante para su tesis de maestría. Maral tiene una maestría en ciencias informáticas avanzadas de la Universidad de Sheffield, Reino Unido.