Dobycha texta, takzhe izwestnaq kak dobycha dannyh, otnositsq k procedure izwlecheniq cennoj informacii iz texta. Princip intellektual'nogo analiza dannyh zaklüchaetsq w obrabotke syroj i nestrukturirowannoj informacii, izwlechenii znachimoj informacii iz texta. Kak prawilo, on wklüchaet w sebq metod strukturirowaniq poluchennogo texta, izwlechenie zakonomernostej, soderzhaschihsq w strukturirowannyh dannyh, i w zaklüchenie ocenku i analiz poluchennogo rezul'tata. Odna iz osnownyh trudnostej algoritmow obucheniq klassifikacii texta zaklüchaetsq w tom, chto dlq ih tochnogo obucheniq trebuetsq bol'shoe kolichestwo primerow, pomechennyh wruchnuü.