L'analisi dei cluster è il raggruppamento di una disposizione di oggetti in modo tale che gli oggetti di un gruppo correlato (noto come cluster) siano ulteriormente correlati a ogni altro gruppo rispetto a quelli di gruppi diversi. Si tratta di un compito fondamentale per l'esame del reperimento delle informazioni e di una procedura caratteristica per l'analisi della conoscenza misurabile, utilizzata nella maggior parte dei campi, come la conoscenza dei dispositivi, l'analisi delle immagini, il miglioramento dei fatti, la bioinformatica, la richiesta di conoscenza e la rappresentazione informatica. Diverse tecniche di clustering gerarchico e le loro varianti sono state molto esplorate nel campo dell'apprendimento automatico. Tuttavia, queste tecniche sono deterministiche, non necessitano di un numero determinato di cluster e sono stabili. Tuttavia, non sono scalabili per set di dati ad alta dimensionalità a causa delle loro correlazioni non lineari. In questa ricerca, stiamo combinando il clustering gerarchico agglomerativo con la classificazione KNN, che offre una migliore accuratezza rispetto al clustering gerarchico. KNN è una tecnica di classificazione ed è l'unico metodo per trovare i medoidi dei cluster formati.