Застосування методів машинного навчання для визначення авторства україномовного тексту
Анотації
В даній роботі розроблено новий узагальнений метод визначення авторства
тексту, який базується на комбінування методів лінгвістики та машинного
навчання, що дозволяє значно підвищити точність атрибуції авторства.
Інформативність обраних чисельних параметрів синтаксичної структури речення
україномовного тексту доведено та ефективність запропонованого методу
підтверджено шляхом порівняльного експерименту для різних україномовних
текстів 3-х авторів різними методами машинного навчання In this work, developed a new generalized method for determining the authorship
of text, which is based on a combination of methods of linguistics and machine learning,
which greatly improves the accuracy of attribution of authorship. The informativeness
of the chosen numerical parameters of the syntactic structure of the sentence of the
Ukrainian-language text is proved and the effectiveness of the proposed method is
confirmed by a comparative experiment for different Ukrainian-language texts of 3
authors by different methods of machine learning.
URI:
http://ir.lib.vntu.edu.ua//handle/123456789/32499