| dc.contributor.author | Белзецький, Р. С. | uk |
| dc.contributor.author | Добровольська, Є. Р. | uk |
| dc.contributor.author | Чернокнижник, А. В. | uk |
| dc.contributor.author | Belzetskyi, R. S. | uk |
| dc.contributor.author | Dobrovolska, Ye. | uk |
| dc.contributor.author | Chernoknyzhnyk, A. | uk |
| dc.date.accessioned | 2026-05-20T11:49:00Z | |
| dc.date.available | 2026-05-20T11:49:00Z | |
| dc.date.issued | 2026 | uk |
| dc.identifier.citation | Белзецький Р. С., Добровольська Є. Р., Чернокнижник А. В. Розробка програмно-апаратного комплексу керування мобільним роботом на основі алгоритму навчання з підкріпленням в середовищі Webots // Наука і техніка сьогодні. Серія: Техніка. 2026. № 4 (58). С. 2765-2781. DOI: https://doi.org/10.52058/2786-6025-2026-4(58)-2765-2781. | uk |
| dc.identifier.issn | 2786-6025 | uk |
| dc.identifier.uri | https://ir.lib.vntu.edu.ua//handle/123456789/51613 | |
| dc.description.abstract | The article considers the application of reinforcement learning
methods for solving the problem of autonomous navigation of mobile robots in a complex dynamic environment. The increasing complexity of robotic systems and
the need for a high level of autonomy necessitate the use of intelligent control
algorithms capable of adapting to uncertain conditions. Special attention is paid to
deep reinforcement learning (DRL) methods, which combine the capabilities of
neural networks and learning approaches through interaction with the environment.
The paper analyzes current research and publications devoted to the use of DRL for
trajectory planning, obstacle avoidance, and developing effective navigation
strategies for mobile robots.
An approach to training a robot for navigation in the Webots simulation
environment is proposed, which allows safe and efficient experimental research.
Reinforcement learning algorithms are used to implement the model, enabling the
robot to gradually form an optimal behavior strategy based on an optimality criterion.
Training occurs through repeated interaction of the robot with the environment,
during which the system accumulates experience and improves decision-making
quality.
The paper describes the model structure, the principle of forming the
reinforcement function, as well as the stages of training and testing the system. A
series of experiments was conducted in the Webots simulation environment to
evaluate the effectiveness of the proposed approach. Analysis of the experimental
results shows stabilization of the agent's behavior during training. The obtained
results confirm the model's ability to effectively find a path to the target point while
avoiding obstacles and optimizing the trajectory.
The proposed approach demonstrates the promise of using deep reinforcement
learning methods for autonomous navigation tasks of mobile robots. The research
results can be used for further improvement of intelligent robot control systems, as
well as for the development of more complex robotic systems capable of operating in
real-world conditions.
Based on the results presented in the paper, a certificate of state registration of
copyright for the computer program "Controller for controlling a mobile robot in the
Webots environment based on a reinforcement learning algorithm" No. 142304 dated
April 10, 2026 was obtained [1]. | en_US |
| dc.description.abstract | У статті розглянуто застосування методів навчання з підкріпленням для розв’язання задачі автономної навігації мобільних роботів у
складному динамічному середовищі. Зростання складності робототехнічних
систем та потреба у високому рівні автономності зумовлюють необхідність
використання інтелектуальних алгоритмів керування, здатних адаптуватися до
невизначених умов. Особливу увагу приділено методам глибокого навчання з
підкріпленням (DRL), які поєднують можливості нейронних мереж і підходів
навчання через взаємодію з середовищем. У роботі проведено аналіз сучасних
наукових досліджень і публікацій, присвячених використанню DRL для задач
планування траєкторії, уникнення перешкод і побудови ефективної навігаційної стратегії мобільних роботів.
Запропоновано підхід до навчання робота навігації у віртуальному
середовищі моделювання Webots, що дозволяє безпечно та ефективно
проводити експериментальні дослідження. Для реалізації моделі використано
алгоритми навчання з підкріпленням, що дає змогу поступово формувати
оптимальну стратегію поведінки на основі критерію оптимальності. Навчання
відбувається шляхом багаторазової взаємодії робота із середовищем, у процесі
якої система накопичує досвід і покращує якість прийняття рішень. У роботі описано структуру моделі, принцип формування функції
підкріплення, а також етапи навчання та тестування системи. Проведено серію
експериментів у симуляційному середовищі Webots з метою оцінювання
ефективності запропонованого підходу. Аналіз результатів експериментів
показує стабілізацію поведінки агента в процесі навчання. Отримані результати
підтверджують здатність моделі ефективно знаходити шлях до цільової точки,
уникаючи перешкод і оптимізуючи траєкторію руху.
Запропонований підхід демонструє перспективність використання методів глибокого навчання з підкріпленням для задач автономної навігації
мобільних роботів. Результати дослідження можуть бути використані для
подальшого вдосконалення інтелектуальних систем керування роботами, а
також для розробки більш складних робототехнічних систем, здатних працювати в реальних умовах.
За результатами, представленими у роботі, отримано свідоцтво про
державну реєстрацію авторського права на комп’ютерну програму «Контролер
керування мобільним роботом у середовищі Webots на основі алгоритму
навчання з підкріпленням» № 145166 від 3.04.2026 [1]. | uk_UA |
| dc.language.iso | uk_UA | uk_UA |
| dc.publisher | Наукові перспективи | uk |
| dc.relation.ispartof | Наука і техніка сьогодні. № 4 (58) : 2765-2781. | uk |
| dc.relation.ispartofseries | Техніка | uk |
| dc.subject | навчання з підкріпленням | uk |
| dc.subject | Webots | uk |
| dc.subject | автономна навігація | uk |
| dc.subject | мобільна робототехніка | uk |
| dc.subject | фізичне моделювання | uk |
| dc.subject | reinforcement learning | uk |
| dc.subject | Webots | uk |
| dc.subject | autonomous navigation | uk |
| dc.subject | mobile robotics | uk |
| dc.subject | physical simulation | uk |
| dc.title | Розробка програмно-апаратного комплексу керування мобільним роботом на основі алгоритму навчання з підкріпленням в середовищі Webots | uk |
| dc.title.alternative | Development of a software and hardware control system for a mobile robot based on a reinforcement learning algorithm in the webots environment | en_US |
| dc.type | Article, professional native edition | |
| dc.identifier.udc | 004.94:004.8:007.52 | uk |
| dc.identifier.doi | https://doi.org/10.52058/2786-6025-2026-4(58)-2765-2781 | uk |
| dc.identifier.orcid | https://orcid.org/0000-0003-1574-8831 | uk |
| dc.identifier.orcid | https://orcid.org/0009-0008-5900-4731 | uk |
| dc.identifier.orcid | https://orcid.org/0009-0001-9532-3624 | uk |