Cette thèse s'attachera à présenter une nouvelle approche pour séparer les formules mathématiques des autres composantes rédactionnelles d'un document mathématique sans passer par un système de reconnaissance optique de caractères. L'extraction se fait d'abord par repérage des opérateurs mathématiques les plus significatifs d'une formule, puis par extension du contexte aux opérateurs avoisinants jusqu'à la délimitation totale de l'espace de la formule. L'étiquetage est réalisé à partir de modèles créés lors d'une phase d'apprentissage utilisant la logique floue. Le taux d'étiquetage primaire est de l'ordre de 95.3%. Mais l'étiquetage secondaire accroît ce taux d'environ 4%. Les résultats obtenus montrent l'applicabilité de notre méthode puisque 93% des formules mathématiques ont pu être extraites d'images de documents de bonne qualité d'impression. Cette thèse synthétise le travail effectué, pose les problèmes rencontrés et discute des résultats obtenus.