33,99 €
inkl. MwSt.
Versandkostenfrei*
Versandfertig in 1-2 Wochen
payback
17 °P sammeln
  • Broschiertes Buch

La diarización de hablantes es el proceso que detecta los hablantes activos y agrupa las señales del habla que ha emitido el mismo hablante. Generalmente podemos encontrar dos aplicaciones principales para la diarización del hablante. Los sistemas de reconocimiento automático del habla utilizan los grupos homogéneos de hablantes para adaptar los modelos acústicos a la dependencia del hablante y, por lo tanto, aumentar el rendimiento del reconocimiento. Los sistemas de indexación del hablante y de transcripción enriquecida también utilizan la salida de la diarización del hablante como…mehr

Produktbeschreibung
La diarización de hablantes es el proceso que detecta los hablantes activos y agrupa las señales del habla que ha emitido el mismo hablante. Generalmente podemos encontrar dos aplicaciones principales para la diarización del hablante. Los sistemas de reconocimiento automático del habla utilizan los grupos homogéneos de hablantes para adaptar los modelos acústicos a la dependencia del hablante y, por lo tanto, aumentar el rendimiento del reconocimiento. Los sistemas de indexación del hablante y de transcripción enriquecida también utilizan la salida de la diarización del hablante como información extraída de una grabación, lo que permite su indexación automática y otros procesamientos posteriores. En el presente estudio se desarrolla una aplicación de diarización del hablante, utilizando grabaciones binaurales multipartitas del habla, para hacer un seguimiento de la actividad del hablante sobre la base de las indicaciones de la diferencia de tiempo interaural (DTI). Estas pistas, para un marco de señal de habla determinado, se calculan utilizando la técnica de filtrado y correlación cruzada de gammatones. Sus valores se utilizan para determinar qué hablante de la grabación produce el fragmento de habla considerado. Este estudio ha sido supervisado por el Dr. Jon Barker, y defendido para cumplir los requisitos para el grado de Master en Informática Avanzada, Universidad de Sheffield, Reino Unido, 2007.
Autorenporträt
Maral Dadvar trabaja en el Grupo de Interacción con los Medios Humanos de la Universidad de Twente, en los Países Bajos, como investigador de doctorado. Desarrolló un interés en el procesamiento del lenguaje natural cuando implementó la diarización del hablante para su tesis de maestría. Maral tiene una maestría en ciencias informáticas avanzadas de la Universidad de Sheffield, Reino Unido.