Удосконалений алгоритм перевірки текстів на подібність
Анотації
Запропоновано алгоритм підвищення якості перевірки текстової інформації на подібність за рахунок використання алгоритму шинглів з можливістю налаштування точності залежно від наявних ресурсів з подальшим порівнянням тексту за допомогою подібності Жаккарда. Це забезпечить швидку та більш якісну обробку великих обсягів текстової інформації. Provided an algorithm for increasing an effectiveness of checking texts for similarity by using shingle algorithm with ability to set up a precise rank of the algorithm depending on available resources with further text comparison using the Jaccard similarity. It will ensure quick handling of big amount of text information.
URI:
http://ir.lib.vntu.edu.ua//handle/123456789/39825