Con la crescita esponenziale dei dati provenienti da vari social network come Facebook, Twitter, applicazioni mobili, fotocamere digitali, reti di sensori ecc. e anche dalle ricerche biomediche, il volume complessivo dei dati è aumentato enormemente. Analizzare ed estrarre informazioni utili da dati così dinamici è quindi oggi un compito molto impegnativo. Il data mining svolge un ruolo fondamentale nella gestione dei big data per analizzare il riconoscimento dei modelli e le previsioni mediche. Possiamo estrarre i dati utilizzando vari algoritmi e tecniche come la classificazione, il clustering, la regressione, le regole di associazione, ecc. Implementa un'efficiente tecnica di data mining chiamata algoritmo Frequent Pattern-Growth (FP-Growth) per analizzare i dati sul diabete raccolti da vari pazienti e generare risultati utili per la predizione. I file memorizzati nel cloud possono essere consultati in qualsiasi momento e da qualsiasi luogo, purché si disponga di un accesso a Internet. Quindi il cloud memorizza i set di dati sul diabete e genera risultati utili di predizione utilizzando l'algoritmo FP-Growth.