Метод визначення схожості новинних текстів на основі статистичної міри “term frequency-inverse document frequency”
Abstract
Метою роботи є розробка методу визначення схожості новинних текстів. У роботі запропоновано метод порівняння схожості новинних текстів на основі статистичної міри “term frequency – inverse document frequency”, наведено результати його застосування. Метод може бути використано для кластеризації новинних текстів. The purpose of the paper is developing of the method of evaluating the similarity between news articles. This paper suggests the method of comparing the similarity of few news articles based on statistics measure “term frequency – inverse document frequency”. The results of the software, that implements suggested method, are also in the paper. The method may be used for clusterization of the news articles
URI:
http://conferences.vntu.edu.ua/index.php/all-fitki/all-fitki-2016/paper/view/688
http://ir.lib.vntu.edu.ua/handle/123456789/10959