L'objectif de ce travail de recherche est de développer un corpus scientifique de la langue Bodo contenant les informations nécessaires à la conception d'un convertisseur texte-parole. Dans cette étude, les critères de conception d'une base de données vocales appelée corpus vocal qui peut nous fournir les données et les informations nécessaires à la recherche vocale sont discutés en détail en référence à une langue indienne, le Bodo. Après avoir généré le corpus de parole, une tentative est faite pour développer un modèle d'annotation de la langue Bodo en suivant une politique spécifique, appelée politique d'étiquetage. Pour le développement d'un convertisseur TTS (Text to Speech) à partir de la parole continue d'une langue, le rôle du modèle d'annotation en suivant la politique de marquage pour cette langue particulière est très important. Ainsi, ce corpus de parole annoté peut aider les chercheurs dans la transparence TTS (Text to Speech) de la langue Bodo par le biais d'une machine informatique.