Disbalans klassow qwlqetsq odnoj iz slozhnyh problem dlq metodow intellektual'nogo analiza dannyh i mashinnogo obucheniq. Dannye w real'nyh prilozheniqh chasto imeüt nesbalansirowannoe raspredelenie po klassam. Jeto proishodit, kogda bol'shinstwo primerow prinadlezhit k klassu bol'shinstwa, a neskol'ko primerow - k klassu men'shinstwa. V ätom sluchae standartnye klassifikatory sklonny otnosit' wse primery k klassu bol'shinstwa i polnost'ü ignorirowat' klass men'shinstwa. Dlq ätoj problemy issledowatelqmi bylo predlozheno mnozhestwo reshenij kak na urowne dannyh, tak i na urowne algoritmow. Bol'shinstwo rabot sosredotocheno na problemah binarnogo klassa. Odnako binarnyj klass - ne edinstwennyj scenarij, w kotorom woznikaet problema disbalansa klassow. V sluchae mnogoklassowyh naborow dannyh gorazdo slozhnee opredelit' bol'shinstwo i men'shinstwo klassow. Poätomu mnogoklassowaq klassifikaciq w nesbalansirowannyh naborah dannyh ostaetsq wazhnoj temoj issledowanij. V nashej knige my predlozhili nowyj podhod, osnowannyj na SOMTE (Synthetic Minority Over-sampling TEchnique) i klasterizacii, kotoryj pozwolqet reshat' problemu nesbalansirowannyh dannyh, wklüchaüschih neskol'ko klassow. My realizowali nash podhod s pomosch'ü instrumentow mashinnogo obucheniq s otkrytym ishodnym kodom: Weka i RapidMiner.