Показати скорочену інформацію

dc.contributor.authorБісікало, О. В.uk
dc.contributor.authorУрлапова, Д. П.uk
dc.contributor.authorТєлєга, Д. І.uk
dc.contributor.authorBisikalo, O. Ven
dc.date.accessioned2025-08-13T09:52:00Z
dc.date.available2025-08-13T09:52:00Z
dc.date.issued2025
dc.identifier.citationБісікало О. В., Урлапов Д. П., Тєлєга Д. І. Класифікація жартів за категоріями гумору з використанням методів машинного навчання // Матеріали Всеукраїнської науково-практичної інтернет-конференції «Молодь в науці: дослідження, проблеми, перспективи (МН-2025)», Вінниця, 15-16 червня 2025 р. URI: https://conferences.vntu.edu.ua/index.php/mn/mn2025/paper/view/25576.uk
dc.identifier.isbn978-617-8163-57-0
dc.identifier.urihttps://ir.lib.vntu.edu.ua//handle/123456789/48246
dc.description.abstractДослідження присвячено задачі автоматичної класифікації жартів (анекдотів) за категорією гумору із застосуванням методів машинного навчання. Запропоновано підхід, що передбачає попередню векторизацію текстів жартів із використанням TF-IDF та балансування вибірки за допомогою SMOTE. Для розв’язання задачі класифікації застосовано логістичну регресію, яка навчалася на синтетично розширених даних. Проведено експерименти на корпусі з чотирьох категорій гумору: абсурд, каламбур, чорний гумор та сарказм. Результати класифікації демонструють високу точність за умови належної підготовки даних і правильного налаштування гіперпараметрів моделі.uk
dc.description.abstractThe study is devoted to the problem of automatic classification of jokes (anecdotes) by humour category using machine learning methods. An approach is proposed that involves pre-vectorization of joke texts using TF-IDF and sample balancing using SMOTE. To solve the classification problem, logistic regression is used, which is trained on synthetically enhanced data. Experiments were conducted on a corpus of four categories of humour: absurdity, pun, black humour and sarcasm. The classification results demonstrate high accuracy provided that the data is properly prepared and the model hyperparameters are correctly adjusted.en
dc.language.isouk_UAuk_UA
dc.publisherВНТУuk
dc.relation.ispartofМатеріали Всеукраїнської науково-практичної інтернет-конференції «Молодь в науці: дослідження, проблеми, перспективи (МН-2025)», Вінниця, 15-16 червня 2025 р.uk
dc.relation.urihttps://conferences.vntu.edu.ua/index.php/mn/mn2025/paper/view/25576
dc.subjectкласифікація жартівuk
dc.subjectмашинне навчанняuk
dc.subjectлогістична регресіяuk
dc.subjectSMOTEen
dc.subjectTF-IDFen
dc.subjectPythonen
dc.subjectjoke classificationen
dc.subjectmachine learningen
dc.subjectlogistic regressionen
dc.titleКласифікація жартів за категоріями гумору з використанням методів машинного навчанняuk
dc.typeThesis
dc.identifier.udc004.932
dc.relation.referencesAttardo S. Humor and Cognitive linguistics. In The Routledge Handbook of cognitive linguistics 2021 Jun 3 (pp. 359-371). Routledge.en
dc.relation.referencesШолота, В.В., Бісікало О.В. Огляд сучасних підходів до автоматичного розпізнавання гумору. Матеріали XLVIII науково-технічної конференції підрозділів ВНТУ, Вінниця, 13-15 березня 2019 р.uk
dc.relation.referencesІнтелектуальна модель стилістичного аналізу гумористичних текстів [Електронний ресурс] // Архів відкритого доступу НУ «ХАІ». – 2023. – Режим доступу: https://openarchive.nure.ua/entities/publication/d733c3c5- 23b3-4b80-b732-430574b69648, вільний.uk
dc.relation.referencesMcKinney W. Python for Data Analysis. 2nd Edition [Текст]. – O'Reilly Media, 2018. – 544 с.en
dc.relation.referencesJurafsky D., Martin J.H. Speech and Language Processing. 3rd ed. – Draft [Електронний ресурс]. – 2020. – Розділ: Vector Semantics and TF-IDF. – Режим доступу: https://web.stanford.edu/~jurafsky/slp3/, вільний.en
dc.relation.referencesChawla N.V., Bowyer K.W., Hall L.O., Kegelmeyer W.P. SMOTE: Synthetic Minority Over-sampling Technique [Текст] // Journal of Artificial Intelligence Research. – 2002. – Т. 16. – С. 321–357.en
dc.relation.referencesPedregosa F. et al. Scikit-learn: Machine Learning in Python [Електронний ресурс] // Journal of Machine Learning Research. – 2011. – Т. 12. – С. 2825–2830. – Режим доступу: https://jmlr.csail.mit.edu/papers/v12/pedregosa11a.html, вільний.en


Файли в цьому документі

Thumbnail

Даний документ включений в наступну(і) колекцію(ї)

Показати скорочену інформацію