49,00 €
inkl. MwSt.
Versandkostenfrei*
Versandfertig in 6-10 Tagen
  • Broschiertes Buch

Die Sprechertagung ist ein Prozess, der aktive Sprecher erkennt und diejenigen Sprachsignale gruppiert, die von demselben Sprecher geäußert wurden. Im Allgemeinen gibt es zwei Hauptanwendungen für die Sprechertypisierung. Automatische Spracherkennungssysteme nutzen die sprecherhomogenen Cluster, um die akustischen Modelle sprecherabhängig anzupassen und damit die Erkennungsleistung zu erhöhen. Sprecherindizierungs- und Rich-Transcription-Systeme nutzen ebenfalls die Sprecherdiarisierungsausgabe als eine der Informationen, die aus einer Aufnahme extrahiert werden und deren automatische…mehr

Produktbeschreibung
Die Sprechertagung ist ein Prozess, der aktive Sprecher erkennt und diejenigen Sprachsignale gruppiert, die von demselben Sprecher geäußert wurden. Im Allgemeinen gibt es zwei Hauptanwendungen für die Sprechertypisierung. Automatische Spracherkennungssysteme nutzen die sprecherhomogenen Cluster, um die akustischen Modelle sprecherabhängig anzupassen und damit die Erkennungsleistung zu erhöhen. Sprecherindizierungs- und Rich-Transcription-Systeme nutzen ebenfalls die Sprecherdiarisierungsausgabe als eine der Informationen, die aus einer Aufnahme extrahiert werden und deren automatische Indizierung und andere Weiterverarbeitung ermöglichen. In dieser Studie wird eine Anwendung zur Sprechertiarisierung entwickelt - unter Verwendung von binauralen Mehrparteien-Sprachaufnahmen - um die Sprecheraktivität basierend auf interauralen Zeitdifferenzen (ITD) zu verfolgen. Diese Cues werden für einen gegebenen Sprachsignalrahmen mittels Gammatone-Filterung und Kreuzkorrelationstechnik berechnet. Ihre Werte werden verwendet, um zu bestimmen, welcher Sprecher in der Aufnahme das betrachtete Sprachfragment produziert hat. Diese Studie wurde von Dr. Jon Barker betreut und zur Erfüllung der Anforderungen für den Master in Advanced Computer Science, University of Sheffield, United Kingdom, 2007 verteidigt.
Autorenporträt
Maral Dadvar trabaja en el Grupo de Interacción con los Medios Humanos de la Universidad de Twente, en los Países Bajos, como investigador de doctorado. Desarrolló un interés en el procesamiento del lenguaje natural cuando implementó la diarización del hablante para su tesis de maestría. Maral tiene una maestría en ciencias informáticas avanzadas de la Universidad de Sheffield, Reino Unido.