Lo sbilanciamento delle classi è uno dei problemi più impegnativi per le tecniche di data mining e di apprendimento automatico. Nelle applicazioni del mondo reale, i dati hanno spesso una distribuzione delle classi squilibrata. Ciò si verifica quando la maggior parte degli esempi appartiene a una classe maggioritaria e pochi esempi appartengono a una classe minoritaria. In questo caso, i classificatori standard tendono a classificare tutti gli esempi come classe maggioritaria e a ignorare completamente la classe minoritaria. Per questo problema, i ricercatori hanno proposto molte soluzioni sia a livello di dati che di algoritmi. La maggior parte degli sforzi si concentra su problemi di classe binaria. Tuttavia, la classe binaria non è l'unico scenario in cui prevale il problema dello sbilanciamento delle classi. Nel caso di insiemi di dati multiclasse, è molto più difficile definire le classi di maggioranza e di minoranza. Pertanto, la classificazione multiclasse in insiemi di dati sbilanciati rimane un importante argomento di ricerca. Nel nostro libro abbiamo proposto un nuovo approccio basato su SOMTE (Synthetic Minority Over-sampling TEchnique) e sul clustering, in grado di affrontare il problema dei dati squilibrati che coinvolgono più classi. Abbiamo implementato il nostro approccio utilizzando strumenti di apprendimento automatico open source: Weka e RapidMiner.