Застосування методів машинного навчання для визначення авторства україномовного тексту
Abstract
Запропоновано підхід до аналізу текстової інформації з метою визначення авторства україномовного тексту. Параметри для характеристики тексту являють собою опис дерев залежностей речень і отримується через україномовний парсер. Розвиток підходу передбачає застосування методів машинного навчання за допомогою лінгвістичного пакету NLTK, що дозволить автоматизувати процес ідентифікації автора. An approach to the analysis of textual information is proposed in order to determine the authorship of the Ukrainianlanguage text. Parameters for the description of the text are a description of dependency trees of the sentences and are obtained through the Ukrainian-language parser. The development of the approach involves the use of methods of machine learning using the linguistic package NLTK, which will automate the process of identification of the author.
URI:
http://ir.lib.vntu.edu.ua//handle/123456789/27258