V dannoj rabote predlagaetsya reshenie zadachi semanticheskoj klasterizacii (kategorizacii) novostnoj lenty sajta. V kachestve metoda ispol'zuetsya algoritm klasterizacii k-means i chastotnyj slovarnyj analiz. Dlya novostnoj lenty sajta sstu.ru byli provedeny jexperimenty s raznym znacheniem parametra k. Dlya poluchennyh klasterov provedjon chastotnyj analiz kljuchevyh slov, na osnove chego predlozheny rekomendacii po kategorizacii fajlov novostnoj lenty sajta.