Показати скорочену інформацію

dc.contributor.authorДадиверін, В. В.uk
dc.contributor.authorБісікало, О. В.uk
dc.contributor.authorDadyverin, V. V.en
dc.contributor.authorBisikalo, О. V.en
dc.date.accessioned2026-04-07T06:50:49Z
dc.date.available2026-04-07T06:50:49Z
dc.date.issued2025
dc.identifier.citationДадиверін В. В., Бісікало О. В. Аналіз та імплементація ідеї навчання великих мовних моделей за аналогією з дитячим когнітивним розвитком // Вчені записки Таврійського національного університету імені В.І. Вернадського. Серія: Технічні науки. 2025. Т. 36 (75), № 4, ч. 2. С. 103-109. DOI: https://doi.org/10.32782/2663-5941/2025.4.2/14.uk
dc.identifier.issn2663-5941
dc.identifier.urihttps://ir.lib.vntu.edu.ua//handle/123456789/51099
dc.description.abstractДослідження присвячено проблематиці недостатньої ефективності великих мовних моделей у питаннях розв’язання математичних завдань, послідовного багатокрокового аналізу та міркування щодо можливих варіантів вирішення. У статті розкрито недосконалість сучасних LLM у питаннях послідовного мислення, попри їхню здатність до генерації природного та осмисленого тексту, вони досі залишаються суттєво обмеженими при вирішенні задач, які потребують логічного міркування або обґрунтування. З’ясовано, що такі обмеження нерідко є наслідком структури навчального процесу мовної моделі, бо той не має нічого спільного з процесами, які відбуваються під час формування когнітивних та ментальних моделей людини. У цій роботі розглянуто підхід навчання за подібністю до когнітивного розвитку людини, який базується на поєднанні наступних концепцій: Curriculum learning – навчання з поетапним збільшенням складності завдань, Scaffolding – сегментоване навчання зі зменшенням рівня опіки після засвоєння певного рівня знань, та прогресивне зміцнення ментальних структур за рахунок створення узагальнених патернів для розв’язання задач. Основну увагу зосереджено на імплементації навчального процесу з поетапним ускладненням вхідного матеріалу – від базових арифметичних рівнянь до великих складених логіко-словесних задач. Ефективність даного підходу оцінено на прикладі моделей Phi-2 та Mistral 7B, навчених в двох режимах: стандартне випадкове навчання та запропоноване контрольоване навчання. Результатами дослідження доведено, що запропонований підхід когнітивного навчання забезпечує кращі результати під час вирішення базових задач та складних багатокомпонентних завдань, які потребують проміжних узагальнених знань. Аналізом подібних досліджень підтверджено перспективність розвитку навчання з імітацією когнітивного розвитку для підвищення ефективності обробки вхідних даних за умов обмеженої кількості навчальної інформації.uk
dc.description.abstractThe study is devoted to the problem of not enough efficiency of large language models in solving mathematical problems, sequential multi-step analysis and reasoning about possible solutions. The article reveals the imperfection of modern LLMs in the issues of sequential thinking, despite their ability to generate natural and meaningful text, they still remain significantly limited in solving problems that require logical reasoning or justification. It was found that such limitations are often a consequence of the structure of the learning process of the language model, because it has nothing to do with the processes that occur during the formation of cognitive and mental models of a person. This work considers the approach of learning by similarity to human cognitive development, which is based on a combination of the following concepts: Curriculum learning – learning with a gradual increase in the complexity of tasks, Scaffolding – segmented learning with a decrease in the level of care after mastering a certain level of knowledge, and progressive strengthening of mental structures by creating generalized patterns for solving problems. The main attention is focused on the implementation of the learning process with a gradual complication of the input material – from basic arithmetic equations to large complex logical-verbal problems. The effectiveness of this approach is evaluated on the example of Phi-2 and Mistral 7B models, trained in two modes: standard random learning and the proposed supervised learning. The results of the study prove that the proposed cognitive learning approach provides better results when solving basic tasks and complex multi-component tasks that require intermediate generalized knowledge. The analysis of similar studies confirms the promising development of training with imitation of cognitive development to increase the efficiency of processing input data under conditions of a limited amount of training information.en
dc.language.isouk_UAuk_UA
dc.publisherТаврійський національний університет ім. В.І. Вернадськогоuk
dc.relation.ispartofВчені записки Таврійського національного університету імені В.І. Вернадського. Т. 36 (75), № 4, ч. 2 : 103-109.uk
dc.relation.ispartofseriesТехнічні наукиuk
dc.subjectвелика мовна модельuk
dc.subjectкогнітивний розвитокuk
dc.subjectадаптивне навчанняuk
dc.subjectlarge language modelen
dc.subjectcognitive developmenten
dc.subjectadaptive learningen
dc.subjectMistral 7Ben
dc.subjectPhi-2en
dc.subjectcurriculum learningen
dc.subjectscaffoldingen
dc.titleАналіз та імплементація ідеї навчання великих мовних моделей за аналогією з дитячим когнітивним розвиткомuk
dc.title.alternativeAnalysis and implementation of ideas for teaching large language models by analogy with children`s cognitive developmenten
dc.typeArticle, professional native edition
dc.typeArticle
dc.identifier.udc004.891:159.953:51
dc.identifier.doihttps://doi.org/10.32782/2663-5941/2025.4.2/14


Файли в цьому документі

Thumbnail

Даний документ включений в наступну(і) колекцію(ї)

Показати скорочену інформацію