39,80 €
inkl. MwSt.
Versandkostenfrei*
Versandfertig in über 4 Wochen
  • Broschiertes Buch

Die Dissertation untersucht künstliche neuronale Netze in der Prosodiemodellierung undkonzentriert sich auf Sprachsynthese. Sie gibt einen Überblick über das Dresdner SynthesesystemDRESS, die Theorie neuronaler Netze sowie die Grundlagen der Prosodiemodellierung.In einem ausführlichen Kapitel werden Netze zur Vorhersage prosodischer Parameter, dieverwendeten Sprachdaten, Trainingsergebnisse und Hörexperimente beschrieben. Um dieVorteile neuronaler und regelbasierter Prosodiemodelle zu kombinieren, wird eine hybrideArchitektur entwickelt und mit Beispielen zur Intonations- bzw. Dauersteuerung…mehr

Produktbeschreibung
Die Dissertation untersucht künstliche neuronale Netze in der Prosodiemodellierung undkonzentriert sich auf Sprachsynthese. Sie gibt einen Überblick über das Dresdner SynthesesystemDRESS, die Theorie neuronaler Netze sowie die Grundlagen der Prosodiemodellierung.In einem ausführlichen Kapitel werden Netze zur Vorhersage prosodischer Parameter, dieverwendeten Sprachdaten, Trainingsergebnisse und Hörexperimente beschrieben. Um dieVorteile neuronaler und regelbasierter Prosodiemodelle zu kombinieren, wird eine hybrideArchitektur entwickelt und mit Beispielen zur Intonations- bzw. Dauersteuerung illustriert.Ein weiteres Kapitel widmet sich der prosodischen Korpus-Analyse und erläutert ein Beispielzur Phrasengrenzen-Detektion. Abschließend werden Modellanwendungen sowie Experimentefür Deutsch, Mandarin-Chinesisch und Französisch vorgestellt. Das integrierte Prosodiemodellberechnet Grundfrequenz, Silbendauer und Intensität in einem Arbeitsschritt. Es wird evolutionäroptimiert. Neuronale und hybride Prosodiemodelle erleichtern die multilinguale Systementwicklung.Die erzielbare Sprachqualität ist von den verfügbaren Trainingsdaten abhängig.
Autorenporträt
Oliver Jokisch studierte Informationstechnik an der Technischen Universität Dresden und an der Loughborough University of Technology in Großbritannien. Seit 1995 arbeitet er am Institut für Akustik und Sprachkommunikation der TU Dresden. Seine Forschungsschwerpunkte betreffen die multilinguale Sprachsynthese (Prosodiegenerierung, Sprachkorpora und Embedded TTS) sowie assistive Technologien, z. B. für den Fremdsprachenerwerb. Er war maßgeblich an der Entwicklung der TTS-Systeme DRESS und MICRODRESS sowie des Aussprachetrainers AzAR beteiligt.Als Projektmanager der GWT-TUD GmbH betreut er seit 1998 industrienahe Entwicklungsprojekte zur Signalverarbeitung und Mustererkennung. Seit 2001 ist er Mitgründer und Berater der voice INTER connect GmbH, die Produkte zur Signalverarbeitung in elektronischen Geräten anbietet.