Il riconoscimento automatico del parlato (ASR) è un processo automatizzato che immette il parlato umano e cerca di capire cosa viene detto. L'ASR è utile, ad esempio, nelle applicazioni speech-to-text (dettatura, trascrizione di riunioni, ecc.), nelle interfacce a controllo vocale, nei motori di ricerca di grandi archivi vocali o video e nella traduzione speech-to-speech. Il Punjabi è la decima lingua più parlata al mondo. Non è stato fatto un lavoro considerevole sulla lingua punjabi per il riconoscimento automatico del parlato. Nel presente lavoro è stato sviluppato un sistema di riconoscimento automatico del parlato per parole isolate utilizzando l'EEMD e la rete neurale, in cui le caratteristiche vengono estratte utilizzando l'EEMD e la segmentazione. Il parlato punjabi per parole isolate viene convertito in testo punjabi. Lo scopo del lavoro è verificare l'accuratezza dell'algoritmo EEMD con segnali rumorosi in contrasto con il riconoscimento vocale. Si procede al rilevamento del livello di rumore e alla segmentazione del segnale per la successiva elaborazione. L'Ensemble empirical mode decomposition (EEMD) è un metodo assistito dal rumore e un miglioramento significativo dell'empirical mode decomposition (EMD).
Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.
Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.