Con l'avvento delle tecnologie Bigdata, i dati sanitari vengono acquisiti e archiviati a più livelli granulari e in più formati. Nel settore sanitario, gli ospedali, le aziende farmaceutiche e le compagnie assicurative dispongono di un'enorme quantità di dati in tabelle strutturate. Tuttavia, quantità significative di big data rimangono sottoutilizzate a causa dell'isolamento, della distribuzione e dell'eterogeneità dei dati. Nonostante l'interconnessione di dati tabellari collegati tra loro in qualche modo per l'input di ML, le sfide sono: aumento della dimensionalità, normalizzazione dei dati che non sono una rappresentazione naturale, ripetizione dei dati nell'unione di diversi dati aggregati tra le tabelle. I modelli di apprendimento automatico suppongono che le osservazioni non siano dipendenti, ma le informazioni del mondo reale sono interconnesse. I grafi della conoscenza e l'apprendimento automatico sono due strumenti importanti per comprendere e modellare concetti complessi, mentre l'apprendimento automatico è un processo attraverso il quale i computer imparano dai dati, senza essere esplicitamente programmati.