35,99 €
inkl. MwSt.
Versandkostenfrei*
Versandfertig in 1-2 Wochen
payback
18 °P sammeln
  • Broschiertes Buch

A diarização do orador é o processo que detecta os oradores activos e agrupa os sinais de fala que foram proferidos pelo mesmo orador. Geralmente podemos encontrar duas aplicações principais para a diarização de alto-falantes. Os sistemas de reconhecimento automático da fala fazem uso dos grupos homogéneos de alto-falantes para adaptar os modelos acústicos para serem dependentes do altifalante e, portanto, aumentar o desempenho do reconhecimento. Os sistemas de indexação e rica transcrição do altifalante também utilizam a saída de diarização do altifalante como uma das informações extraídas de…mehr

Produktbeschreibung
A diarização do orador é o processo que detecta os oradores activos e agrupa os sinais de fala que foram proferidos pelo mesmo orador. Geralmente podemos encontrar duas aplicações principais para a diarização de alto-falantes. Os sistemas de reconhecimento automático da fala fazem uso dos grupos homogéneos de alto-falantes para adaptar os modelos acústicos para serem dependentes do altifalante e, portanto, aumentar o desempenho do reconhecimento. Os sistemas de indexação e rica transcrição do altifalante também utilizam a saída de diarização do altifalante como uma das informações extraídas de uma gravação, que permitem a sua indexação automática e outros processamentos posteriores. Neste estudo é desenvolvida uma aplicação de diarização do altifalante - utilizando gravações de fala binaural multipartidárias - para acompanhar a actividade do altifalante com base em sinais de diferença de tempo interaural (ITD). Estas indicações, para um determinado quadro de sinal de fala, são computadas utilizando a técnica de filtragem gammatone e de correlação cruzada. Os seus valores são utilizados para determinar qual dos oradores na gravação produz o fragmento de fala considerado. Este estudo foi supervisionado pelo Dr. Jon Barker, e defendeu o cumprimento dos requisitos para o grau de Mestrado em Ciência Informática Avançada, Universidade de Sheffield, Reino Unido, 2007.
Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.
Autorenporträt
Maral Dadvar trabaja en el Grupo de Interacción con los Medios Humanos de la Universidad de Twente, en los Países Bajos, como investigador de doctorado. Desarrolló un interés en el procesamiento del lenguaje natural cuando implementó la diarización del hablante para su tesis de maestría. Maral tiene una maestría en ciencias informáticas avanzadas de la Universidad de Sheffield, Reino Unido.