V poslednie gody, s massowym razwitiem informacionnogo obschestwa, Internet stal cennym istochnikom informacii prakticheski dlq wseh potencial'nyh oblastej znanij. Jeto pobudilo mnogih issledowatelej nachat' rassmatriwat' web w kachestwe zakonnogo hranilischa dlq zadach informacionnogo poiska (IR) i polucheniq znanij. Veb sostoit iz ogromnogo kolichestwa informacii, otnosqschejsq ko wsem wozmozhnym oblastqm znanij, i ego wysokaq izbytochnost' mozhet stat' nadezhnym istochnikom znanij dlq wychisleniq shodstwa. Poätomu sistemy intellektual'nogo analiza textow stalkiwaütsq s ogromnym kolichestwom atributow. Dlq obnaruzheniq znanij w sistemah baz dannyh neobhodimo predstawit' whodnye texty w wide nabora atributow, chtoby rabotat' s nimi. Metod preobrazowaniq texta w predstawlenie izwesten kak indexirowanie texta ili dokumenta, a atributy nazywaütsq indexami. Indexirowanie stanowitsq kriticheski wazhnoj zadachej w textowom analize, poskol'ku ono dolzhno predstawlqt' informaciü w texte s minimal'nymi poterqmi semantiki dlq ee dal'nejshego ispol'zowaniq.