Metody dobychi texta (TM) prakticheski ispol'zuütsq w web-prilozheniqh, akademicheskih krugah, i internet-industrii, a takzhe w drugih oblastqh. V oblasti issledowanij, on pomogaet identificirowat' i klassificirowat' issledowatel'skie raboty i swqzannye s nimi zametki iz mnogih oblastej, kotorye mozhno poluchit' iz otdel'nyh mest. Esli gruppa predlozhenij prinadlezhit k opredelennoj oblasti issledowanij i mozhet soderzhat' bol'shoe kolichestwo predlozhenij, äti predlozheniq gruppiruütsq i predostawlqütsq recenzentu. Metod ontologii qwlqetsq wozmozhnoj tehnikoj w ätoj oblasti. Dlqresheniq zadachi awtomaticheskoj klassifikacii textowyh dokumentow ispol'zuütsq metody textowogo analiza . V dannoj rabote issledowatel'skie predlozheniq klassificiruütsq po disciplinarnym oblastqm, a predlozheniq po kazhdoj discipline gruppiruütsq s pomosch'ü metoda analiza texta. Na ätape 1 ispol'zuütsq metody predwaritel'noj obrabotki, takie kak wydelenie slow, stop-slow, stebling i chastota termina - obratnaq chastota dokumenta (TF/IDF), dlq tokenizacii, steblq slowa i podscheta chastoty slowa, prisutstwuüschego w issledowatel'skom predlozhenii.