Dieses Buch zeigt, wie man die neuesten Methoden des maschinellen Lernens (Deep Learning) für die Vorhersage der Sprachqualität einsetzen kann. Der Autor zeigt, wie die jüngsten Fortschritte im Bereich des maschinellen Lernens für die Aufgabe der Sprachqualitätsvorhersage genutzt werden können und bietet eine eingehende Analyse der Eignung verschiedener Deep-Learning-Architekturen für diese Aufgabe. Der Autor zeigt dann, wie das resultierende Modell herkömmliche Sprachqualitätsmodelle übertrifft und zusätzliche Informationen über die Ursache einer Qualitätsbeeinträchtigung durch die Vorhersage…mehr
Dieses Buch zeigt, wie man die neuesten Methoden des maschinellen Lernens (Deep Learning) für die Vorhersage der Sprachqualität einsetzen kann. Der Autor zeigt, wie die jüngsten Fortschritte im Bereich des maschinellen Lernens für die Aufgabe der Sprachqualitätsvorhersage genutzt werden können und bietet eine eingehende Analyse der Eignung verschiedener Deep-Learning-Architekturen für diese Aufgabe. Der Autor zeigt dann, wie das resultierende Modell herkömmliche Sprachqualitätsmodelle übertrifft und zusätzliche Informationen über die Ursache einer Qualitätsbeeinträchtigung durch die Vorhersage der Sprachqualitätsdimensionen Rauschen, Färbung, Diskontinuität und Lautheit liefert.
Originaltitel: Deep Learning Based Speech Quality Prediction
Artikelnr. des Verlages: 89236786, 978-3-031-38586-5
1. Aufl. 2024
Seitenzahl: 174
Erscheinungstermin: 3. Oktober 2024
Deutsch
Abmessung: 235mm x 155mm
ISBN-13: 9783031385865
ISBN-10: 3031385861
Artikelnr.: 68265991
Autorenporträt
Gabriel Mittag erhielt seinen B.Sc. und M.Sc. in Elektrotechnik und Elektronik an der Technischen Universität Berlin. Während seines Masterstudiums verbrachte er zwei Semester an der RMIT University in Melbourne, Australien und beschäftigte sich vor allem mit biomedizinischer und Sprachsignalverarbeitung. Ab 2016 war er als wissenschaftlicher Mitarbeiter am Quality and Usability Lab der TU Berlin tätig und promovierte dort über die maschinelle lernbasierte Vorhersage von Sprachqualität. Im Mai 2021 begann Gabriel Mittag als Machine Learning Scientist bei Microsoft in Redmond, WA, USA.
Inhaltsangabe
1.Einführung.- 2. Qualitätsbewertung der übertragenen Sprache - 3. Neuronale Netzwerkarchitekturen für die Vorhersage der Sprachqualität - 4. Doppelendige Sprachqualitätsvorhersage mit Siamesischen Netzen.- 5. Vorhersage von Sprachqualitätsdimensionen mit Multi-Task-Lernen - 6. Bias-Aware Loss für das Training aus mehreren Datensätzen.- 7. NISQA - Ein einseitiges Sprachqualitätsmodell.- 8. Schlussfolgerungen.- A. Datensatz-Zustandstabellen.- B. Dimensionshistogramme für Trainings- und Validierungsdatensätze.- Referenzen.
1.Einführung.- 2. Qualitätsbewertung der übertragenen Sprache - 3. Neuronale Netzwerkarchitekturen für die Vorhersage der Sprachqualität - 4. Doppelendige Sprachqualitätsvorhersage mit Siamesischen Netzen.- 5. Vorhersage von Sprachqualitätsdimensionen mit Multi-Task-Lernen - 6. Bias-Aware Loss für das Training aus mehreren Datensätzen.- 7. NISQA - Ein einseitiges Sprachqualitätsmodell.- 8. Schlussfolgerungen.- A. Datensatz-Zustandstabellen.- B. Dimensionshistogramme für Trainings- und Validierungsdatensätze.- Referenzen.
Es gelten unsere Allgemeinen Geschäftsbedingungen: www.buecher.de/agb
Impressum
www.buecher.de ist ein Shop der buecher.de GmbH & Co. KG Bürgermeister-Wegele-Str. 12, 86167 Augsburg Amtsgericht Augsburg HRA 13309