A diarização do orador é o processo que detecta os oradores activos e agrupa os sinais de fala que foram proferidos pelo mesmo orador. Geralmente podemos encontrar duas aplicações principais para a diarização de alto-falantes. Os sistemas de reconhecimento automático da fala fazem uso dos grupos homogéneos de alto-falantes para adaptar os modelos acústicos para serem dependentes do altifalante e, portanto, aumentar o desempenho do reconhecimento. Os sistemas de indexação e rica transcrição do altifalante também utilizam a saída de diarização do altifalante como uma das informações extraídas de uma gravação, que permitem a sua indexação automática e outros processamentos posteriores. Neste estudo é desenvolvida uma aplicação de diarização do altifalante - utilizando gravações de fala binaural multipartidárias - para acompanhar a actividade do altifalante com base em sinais de diferença de tempo interaural (ITD). Estas indicações, para um determinado quadro de sinal de fala, são computadas utilizando a técnica de filtragem gammatone e de correlação cruzada. Os seus valores são utilizados para determinar qual dos oradores na gravação produz o fragmento de fala considerado. Este estudo foi supervisionado pelo Dr. Jon Barker, e defendeu o cumprimento dos requisitos para o grau de Mestrado em Ciência Informática Avançada, Universidade de Sheffield, Reino Unido, 2007.
Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.
Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.