Kolichestwo textowyh dokumentow rastet s neweroqtnoj skorost'ü, i ochen' chasto woznikaet neobhodimost' klassificirowat' äti dokumenty po nekotorym fixirowannym zaranee opredelennym kategoriqm. Koncepcii intellektual'nogo analiza texta i mashinnogo obucheniq ochen' pomogaüt w ätoj zadache awtomatizirowannoj klassifikacii dokumentow. Poskol'ku klassifikaciq osuschestwlqetsq awtomaticheski, klassifikator dolzhen byt' horoshim klassifikatorom, chtoby bylo kak mozhno men'she oshibochnyh klassifikacij. Poätomu tochnost' klassifikacii ochen' wazhna, i o nej neobhodimo pozabotit'sq. Suschestwuüt razlichnye faktory, kotorye mogut powliqt' na tochnost' klassifikacii klassifikatorow. Odnim iz takih faktorow qwlqetsq metod otbora priznakow, ispol'zuemyj dlq umen'sheniq kolichestwa priznakow w dokumentah. Information Gain (IG) - odin iz samyh populqrnyh metodow, ispol'zuemyh dlq ätoj zadachi, no u ätogo metoda ocenki luchshih slow est' neskol'ko nedostatkow. V nashej rabote my razrabotali nowuü formulu dlq ocenki slow w dokumentah i, takim obrazom, nahozhdeniq luchshih slow, kotorye bolee polezny w zadache klassifikacii. Nash metod naprawlen na poisk teh slow, kotorye obladaüt bol'shej diskriminacionnoj sposobnost'ü, chem drugie, poätomu my nazwali nashu formulu Discriminating Power (DP).
Bitte wählen Sie Ihr Anliegen aus.
Rechnungen
Retourenschein anfordern
Bestellstatus
Storno