Com o advento das tecnologias Bigdata, os dados relativos aos cuidados de saúde são capturados e armazenados a vários níveis granulares e em vários formatos. No domínio dos cuidados de saúde, os hospitais, as empresas farmacêuticas e as companhias de seguros dispõem de uma enorme quantidade de dados em tabelas estruturadas. No entanto, quantidades significativas de grandes volumes de dados continuam a ser subutilizadas devido ao isolamento, à distribuição e à heterogeneidade dos dados. Apesar de os dados tabulares interligados estarem de alguma forma ligados entre si para a entrada de ML, os desafios são o aumento da dimensionalidade, a normalização dos dados que não são uma representação natural, a repetição de dados na fusão de diferentes dados agregados entre tabelas. Os modelos de aprendizagem automática pressupõem que as observações não são dependentes, no entanto, a informação do mundo real está interligada. Os gráficos de conhecimento e a aprendizagem automática são duas ferramentas importantes para compreender e modelar conceitos complexos, enquanto a aprendizagem automática é um processo pelo qual os computadores aprendem a partir de dados, sem serem explicitamente programados.