Avec l'avènement des technologies Bigdata, les données de santé sont capturées et stockées à de multiples niveaux de granularité et dans de multiples formats. Dans le domaine des soins de santé, les hôpitaux, les sociétés pharmaceutiques et les compagnies d'assurance disposent d'une énorme quantité de données dans des tableaux structurés. Cependant, des quantités importantes de ces données restent sous-utilisées en raison de l'isolement, de la distribution et de l'hétérogénéité des données. Malgré l'interconnexion des données tabulaires reliées d'une certaine manière pour l'entrée de l'apprentissage automatique, les défis sont les suivants : augmentation de la dimensionnalité, normalisation des données qui ne sont pas des représentations naturelles, répétition des données lors de la fusion de différentes données agrégées dans les tableaux. Les modèles d'apprentissage automatique supposent que les observations ne sont pas dépendantes, mais les informations du monde réel sont interconnectées. Les graphes de connaissances et l'apprentissage automatique sont deux outils importants pour comprendre et modéliser des concepts complexes, tandis que l'apprentissage automatique est un processus par lequel les ordinateurs apprennent à partir de données, sans être explicitement programmés.