Визначення авторства україномовного тексту на основі методів машинного навчання
Автор
Бісікало, О. В.
Іщенко, О. Р.
Bisikalo, O. V.
Дата
2025Metadata
Показати повну інформаціюCollections
Анотації
Дослідження присвячено задачі автоматичного визначення авторства україномовного тексту на основі методів машинного навчання. Запропоновано підхід, що передбачає формалізацію синтаксичних ознак, отриманих в результаті аналізу речень. Сформовано набір із 11 структурних характеристик, які дозволяють кількісно описати стиль автора на рівні синтаксису. Для розв’язання задачі атрибуції використано багатошаровий перцептрон, навчання якого здійснюється на основі витягнутих ознак. Експериментальні результати, отримані на корпусі творів трьох українських авторів, підтверджують ефективність запропонованого підходу та демонструють високу точність класифікації за умови належної попередньої обробки даних. The research focuses on the task of automatic authorship attribution for Ukrainian-language texts using machine
learning methods. The proposed approach involves formalizing syntactic features obtained through parsing of sentences.
A set of 11 structural characteristics has been developed to quantitatively represent an author’s style at the syntactic
level. A multilayer perceptron is used to solve the attribution task, trained on the extracted features. Experimental results
based on a corpus of texts by three Ukrainian authors confirm the effectiveness of the proposed method and demonstrate
high classification accuracy with proper data preprocessing.
URI:
https://ir.lib.vntu.edu.ua//handle/123456789/48024

