Qui a parlé quand ?

Estimation de l'emplacement du haut-parleur pour la diarisation

Fotogalerie

Maral Dadvar

Qui a parlé quand ?

Estimation de l'emplacement du haut-parleur pour la diarisation

Broschiertes Buch

Jetzt bewerten Jetzt bewerten

Autorenporträt

Andere Kunden interessierten sich auch für

Produktbeschreibung

La diarisation du locuteur est le processus qui détecte les locuteurs actifs et regroupe les signaux vocaux qui ont été émis par le même locuteur. En général, on peut trouver deux applications principales pour la diarisation du locuteur. Les systèmes de reconnaissance automatique de la parole utilisent les groupes homogènes de locuteurs pour adapter les modèles acoustiques en fonction du locuteur et donc augmenter les performances de reconnaissance. Les systèmes d'indexation du locuteur et de transcription riche utilisent également la sortie de diarisation du locuteur comme une des informations extraites d'un enregistrement, ce qui permet son indexation automatique et d'autres traitements ultérieurs. Dans cette étude, une application de diarisation du locuteur est développée - en utilisant des enregistrements binauraux multipartites de la parole - pour suivre l'activité du locuteur sur la base d'indices de différence de temps interauraux (ITD). Ces indices, pour une trame de signal vocal donnée, sont calculés en utilisant le filtrage gammatone et la technique de corrélation croisée. Leurs valeurs sont utilisées pour déterminer quel locuteur de l'enregistrement produit le fragment de parole considéré. Cette étude a été supervisée par le Dr Jon Barker, et a été défendue pour remplir les exigences du diplôme de Master en informatique avancée, Université de Sheffield, Royaume-Uni, 2007.

Produktdetails

Produktdetails
Verlag: Editions Notre Savoir
Seitenzahl: 72
Erscheinungstermin: 2. Januar 2021
Französisch
Abmessung: 220mm x 150mm x 5mm
Gewicht: 125g
ISBN-13: 9786203172331
ISBN-10: 6203172332
Artikelnr.: 60854446

Herstellerkennzeichnung
Books on Demand GmbH
Überseering 33
22297 Hamburg
bod@bod.de

Produktdetails

Verlag: Editions Notre Savoir
Seitenzahl: 72
Erscheinungstermin: 2. Januar 2021
Französisch
Abmessung: 220mm x 150mm x 5mm
Gewicht: 125g
ISBN-13: 9786203172331
ISBN-10: 6203172332
Artikelnr.: 60854446

Herstellerkennzeichnung
Books on Demand GmbH
Überseering 33
22297 Hamburg
bod@bod.de

Autorenporträt

Maral Dadvar trabaja en el Grupo de Interacción con los Medios Humanos de la Universidad de Twente, en los Países Bajos, como investigador de doctorado. Desarrolló un interés en el procesamiento del lenguaje natural cuando implementó la diarización del hablante para su tesis de maestría. Maral tiene una maestría en ciencias informáticas avanzadas de la Universidad de Sheffield, Reino Unido.