L'exploration de textes ou de données est un outil de découverte de connaissances qui se réfère au processus d'extraction de modèles intéressants et non triviaux à partir d'une base de données de textes non structurés. Nous présentons ici un nouveau système d'apprentissage automatique permettant d'explorer des ensembles de données biologiques (données textuelles/littérature scientifique) afin de comprendre les relations entre deux gènes (deux termes) dans un texte scientifique. Le système imite l'intelligence humaine et détermine avec précision les relations entre deux gènes/protéines. Nous avons curé manuellement les ensembles de données de la littérature à l'aide de la curation profonde pour générer un ensemble d'entraînement. En outre, nos résultats de prédiction ont été validés avec l'aide d'experts pour générer la confiance nécessaire à l'utilisation de notre système dans différentes situations en temps réel. Ensuite, le système a été automatisé afin que les personnes du monde entier puissent déterminer les relations entre deux ou plusieurs molécules dans un texte à l'aide de machines à vecteurs de support. Ce système semi-automatisé est fréquemment utilisé par notre équipe pour rédiger des critiques sur un sujet donné.