O reconhecimento da fala usando a rede neural Convolution, é usado para reconhecer as palavras e digitalizá-las e analisar o som. Treina um modelo de aprendizagem profunda que detecta a presença de comandos de fala em áudio que implementou usando o MATLAB. Utiliza uma rede neural de convolução para treinar um modelo. O modelo foi treinado para comandos e ruído de fundo. O modelo treinado obtém precisão de 96,34% enquanto testa os dados. Define o nível para processamento de áudio e o nível de identificação em Hz e constrói um visualizador de interface de áudio que pode interpretar o áudio do seu microfone. Quando falamos comandos, ele detecta e visualiza e nós falamos outros comandos que não os comandos que ele mostra desconhecidos. Quando não falamos nada, ele detecta ruído de fundo.