Diaryzacja g¿o¿ników jest procesem, który wykrywa aktywnych mówców i grupuje te sygnäy mowy, które zostäy wypowiedziane przez tego samego mówc¿. Generalnie mo¿emy znale¿¿ dwa g¿ówne zastosowania diaryzacji g¿o¿ników. Systemy automatycznego rozpoznawania mowy wykorzystuj¿ homogeniczne klastry g¿o¿ników, aby dostosowä modele akustyczne do potrzeb osób mówi¿cych, a tym samym zwi¿kszy¿ wydajno¿¿ rozpoznawania. Systemy indeksowania g¿o¿ników i bogate systemy transkrypcji wykorzystuj¿ równie¿ wyj¿cie diaryzacji g¿o¿ników jako jedn¿ z informacji pozyskiwanych z nagrania, co pozwala na jego automatyczn¿ indeksacj¿ i inne dalsze przetwarzanie. W niniejszym opracowaniu opracowano aplikacj¿ do diaryzacji g¿o¿ników - wykorzystuj¿c¿ wielocz¿¿ciowe obuuszne nagrania mowy - do ¿ledzenia aktywno¿ci g¿o¿ników w oparciu o podpowiedzi dotycz¿ce ró¿nicy czasu mi¿dzy s¿uchaczami (ITD). Te sygnäy, dla danej ramki sygnäu mowy, s¿ obliczane przy u¿yciu filtrowania gammatonowego i techniki korelacji krzy¿owej. Ich warto¿ci s¿ wykorzystywane do okre¿lenia, który z mówców w nagraniu wytwarza dany fragment mowy. Badania te by¿y nadzorowane przez dr Jona Barkera i bronione w celu spe¿nienia wymagä do uzyskania stopnia magistra zaawansowanej informatyki, University of Sheffield, Wielka Brytania, 2007.
Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.
Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.