Kto mówi¿ kiedy?

Oszacowanie lokalizacji g¿o¿ników dla diaryzacji w oparciu o d¿wi¿k

Fotogalerie

Maral Dadvar

Kto mówi¿ kiedy?

Oszacowanie lokalizacji g¿o¿ników dla diaryzacji w oparciu o d¿wi¿k

Broschiertes Buch

Jetzt bewerten Jetzt bewerten

Autorenporträt

Andere Kunden interessierten sich auch für

Maral Dadwar
Kto goworil, kogda?

31,99 €
Ayotunde Lawal
Studium wst¿pne dotycz¿ce rozwoju aplikacji biznesowej

26,99 €
Humberto Avila
OCENA AUTOMATYCZNEJ SEGMENTACJI I OBJ¿TO¿CIOWEGO STARZENIA SI¿

18,99 €
Jason Argüello Pin
Aplikacja komputerowa do zarz¿dzania procesami

25,99 €
Juan Solórzano
Mapowanie zdarze¿

18,99 €
Vladimir Baltrashevich
Inteligentny AOS oparty na li¿cie atrybutów

27,99 €
Tanuja Dhope-Shendkar
Wykrywanie i okre¿lanie dojrza¿o¿ci Mango

18,99 €

Produktbeschreibung

Diaryzacja g¿o¿ników jest procesem, który wykrywa aktywnych mówców i grupuje te sygnäy mowy, które zostäy wypowiedziane przez tego samego mówc¿. Generalnie mo¿emy znale¿¿ dwa g¿ówne zastosowania diaryzacji g¿o¿ników. Systemy automatycznego rozpoznawania mowy wykorzystuj¿ homogeniczne klastry g¿o¿ników, aby dostosowä modele akustyczne do potrzeb osób mówi¿cych, a tym samym zwi¿kszy¿ wydajno¿¿ rozpoznawania. Systemy indeksowania g¿o¿ników i bogate systemy transkrypcji wykorzystuj¿ równie¿ wyj¿cie diaryzacji g¿o¿ników jako jedn¿ z informacji pozyskiwanych z nagrania, co pozwala na jego automatyczn¿ indeksacj¿ i inne dalsze przetwarzanie. W niniejszym opracowaniu opracowano aplikacj¿ do diaryzacji g¿o¿ników - wykorzystuj¿c¿ wielocz¿¿ciowe obuuszne nagrania mowy - do ¿ledzenia aktywno¿ci g¿o¿ników w oparciu o podpowiedzi dotycz¿ce ró¿nicy czasu mi¿dzy s¿uchaczami (ITD). Te sygnäy, dla danej ramki sygnäu mowy, s¿ obliczane przy u¿yciu filtrowania gammatonowego i techniki korelacji krzy¿owej. Ich warto¿ci s¿ wykorzystywane do okre¿lenia, który z mówców w nagraniu wytwarza dany fragment mowy. Badania te by¿y nadzorowane przez dr Jona Barkera i bronione w celu spe¿nienia wymagä do uzyskania stopnia magistra zaawansowanej informatyki, University of Sheffield, Wielka Brytania, 2007.

Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.

Produktdetails

Produktdetails
Verlag: Wydawnictwo Nasza Wiedza
Seitenzahl: 72
Erscheinungstermin: 2. Januar 2021
Polnisch
Abmessung: 220mm x 150mm x 5mm
Gewicht: 125g
ISBN-13: 9786203172539
ISBN-10: 6203172537
Artikelnr.: 62307831

Herstellerkennzeichnung

Produktdetails

Verlag: Wydawnictwo Nasza Wiedza
Seitenzahl: 72
Erscheinungstermin: 2. Januar 2021
Polnisch
Abmessung: 220mm x 150mm x 5mm
Gewicht: 125g
ISBN-13: 9786203172539
ISBN-10: 6203172537
Artikelnr.: 62307831

Herstellerkennzeichnung

Autorenporträt

Maral Dadvar trabaja en el Grupo de Interacción con los Medios Humanos de la Universidad de Twente, en los Países Bajos, como investigador de doctorado. Desarrolló un interés en el procesamiento del lenguaje natural cuando implementó la diarización del hablante para su tesis de maestría. Maral tiene una maestría en ciencias informáticas avanzadas de la Universidad de Sheffield, Reino Unido.