Automatische Spracherkennung (ASR) ist ein automatischer Prozess, der menschliche Sprache einliest und versucht herauszufinden, was gesagt wird. ASR ist z. B. nützlich für Sprache-zu-Text-Anwendungen (Diktat, Transkription von Sitzungen usw.), sprachgesteuerte Schnittstellen, Suchmaschinen für große Sprach- oder Videoarchive und Sprache-zu-Sprache-Übersetzung. Punjabi ist die zehntmeistgesprochene Sprache der Welt. Bisher wurden keine nennenswerten Arbeiten zur automatischen Spracherkennung in Punjabi durchgeführt. In der vorliegenden Arbeit wird ein automatisches Spracherkennungssystem für isolierte Wörter unter Verwendung von EEMD und neuronalen Netzwerken entwickelt, wobei die Merkmale mit EEMD extrahiert und die Segmentierung vorgenommen wird. Die Punjabi-Sprache für isolierte Wörter wird in Punjabi-Text umgewandelt. Das Ziel dieser Arbeit ist es, die Genauigkeit des EEMD-Algorithmus bei verrauschten Signalen im Gegensatz zur Spracherkennung zu überprüfen. Wir gehen dabei so vor, dass wir den Rauschpegel erkennen und das Signal für die weitere Verarbeitung segmentieren. Die Ensemble Empirical Mode Decomposition (EEMD) ist eine rauschunterstützte Methode und eine deutliche Verbesserung der Empirical Mode Decomposition (EMD).
Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.
Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.