O aumento do número de casos de diabetes tipo 2 impulsionou a investigação de sistemas de diagnóstico robustos. A integração da aprendizagem automática melhora estes sistemas, analisando diversos conjuntos de dados e abordando complicações associadas como a obesidade, os maus hábitos e a hipertensão. A deteção precoce é crucial, dadas as graves implicações para a saúde. A aprendizagem automática, aliada ao processamento de linguagem natural, ajuda no prognóstico, no diagnóstico e nos planos de prevenção. Utilizando o conjunto de dados PIDD (768 amostras, 16 atributos), esta investigação centra-se na previsão da diabetes com um conjunto alargado de características. O pré-processamento envolve normalização, balanceamento com SMOTE e verificações de integridade para melhorar a precisão do modelo. Em geral, este estudo enfatiza o papel fundamental do ML no avanço da compreensão e das capacidades de previsão da Diabetes Tipo 2 através de metodologias meticulosas e da seleção de conjuntos de dados.