Показати скорочену інформацію

dc.contributor.authorРоботько, С. П.uk
dc.contributor.authorТопалов, А. М.uk
dc.contributor.authorRobotko, S. P.en
dc.contributor.authorTopalov, A. M.en
dc.date.accessioned2026-02-12T14:27:47Z
dc.date.available2026-02-12T14:27:47Z
dc.date.issued2025
dc.identifier.citationРоботько С. П., Топалов А. М. Багаторівнева архітектура системи автоматичного керування бпла для здійснення пошукових місій за відеоаналізом та металодетекцією // Оптико-електроннi iнформацiйно-енергетичнi технологiї. 2025. № 2. С. 114-124. URI: https://oeipt.vntu.edu.ua/index.php/oeipt/article/view/804.uk
dc.identifier.issn2311-2662
dc.identifier.urihttps://ir.lib.vntu.edu.ua//handle/123456789/50626
dc.description.abstractУ статті представлено багаторівневу систему автоматичного керування місіями безпілотного літального апарата у задачах виявлення підозрілих предметів. Запропонована архітектура поєднує edge–ground–cloud обробку даних з бортової відеокамери та металодетектора, а також використання візуально-мовних моделей (ChatGPT-4.1 Vision, Gemini 2.5 Flash) для семантичної верифікації підозрілих предметів. На наземній станції виконується первинна детекція небезпечних предметів за допомогою YOLOv8 та аналіз сигналу металодетектора, після чого кадри з проміжною впевненістю надсилаються у хмару для додаткової перевірки VLM. На основі об’єднаної оцінки формується рішення про наявність небезпечного предмета, яке через MAVLink автоматично коригує місію БПЛА завдяки чому дрон переводиться з режиму AUTO в GUIDED, повертається за GPS-координатами підозри, виконує додаткове обстеження та після цього відновлює маршрут із збереженої точки. Експериментальні випробування на полігоні з макетами небезпечних предметів показали, що комбінування YOLOv8, металодетектора та VLM дозволяє досягти підвищення точності до ≈95,7% і збереженні роботи в режимі, близькому до реального часу (ефективно 5 кадрів/с). Наукова новизна роботи полягає в реалізації замкненого циклу «виявлення – семантична перевірка – автоматичне коригування місії» для БПЛА, що поєднує мультимодальне злиття даних і хмарні AI-моделі та знижує навантаження на оператора.uk
dc.description.abstractThe article presents a multi-level automatic mission control system for an unmanned aerial vehicle designed to detect hazardous items in tasks involving the identification of suspicious objects. The proposed architecture combines edge–ground–cloud data processing the onboard video camera and metal detector, as well as the use of vision–language models (ChatGPT-4.1 Vision, Gemini 2.5 Flash) for semantic verification of suspected objects. At the ground station, initial detection of hazardous items is performed using YOLOv8 and metal-detector signal analysis. Frames with intermediate confidence are then sent to the cloud for additional verification by VLMs. Based on the combined assessment, a decision is generated regarding the presence of a hazardous item, which automatically adjusts the UAV mission via MAVLink: the drone is switched AUTO to GUIDED mode, returns to the GPS coordinates of the suspicion, performs additional inspection, and then resumes the mission the saved waypoint. Experimental field tests with mock-ups of hazardous items demonstrated that combining YOLOv8, the metal detector, and VLMs makes it possible to achieve increasing precision to approximately 95.7% and maintaining near-real-time performance (effective 5 fps). The scientific novelty of the work lies in implementing a closed loop of “detection – semantic verification – automatic mission correction” for UAVs, which integrates multimodal data fusion with cloud-based AI models and reduces operator workload.en
dc.language.isouk_UAuk_UA
dc.publisherВНТУuk
dc.relation.ispartofОптико-електроннi iнформацiйно-енергетичнi технологiї. № 2 : 114-124.uk
dc.relation.urihttps://oeipt.vntu.edu.ua/index.php/oeipt/article/view/804
dc.subjectбезпілотні літальні апарати (БПЛА)uk
dc.subjectкомп’ютерний зірuk
dc.subjectбагаторівневий аналіз відеозображеньuk
dc.subjectметалодетекторuk
dc.subjectвізуально-мовні моделіuk
dc.subjectавтоматизована система керуванняuk
dc.subjectзворотний зв’язокuk
dc.subjectбагаторівнева архітектураuk
dc.subjectMAVLinken
dc.subjectunmanned aerial vehicles (UAVs)en
dc.subjectcomputer visionen
dc.subjectmulti-level video-image analysisen
dc.subjectmetal detectoren
dc.subjectvision–language modelsen
dc.subjectautomatic control systemen
dc.subjectfeedbacken
dc.subjectmultilevel architectureen
dc.subjectMAVLinken
dc.titleБагаторівнева архітектура системи автоматичного керування БПЛА для здійснення пошукових місій за відеоаналізом та металодетекцієюuk
dc.title.alternativeMulti-level architecture of automatic UAVs control system for search missions using video analysis and metal detectionen
dc.typeArticle, professional native edition
dc.typeArticle
dc.identifier.udc681.516+004.932.2
dc.relation.referencesVivoli, E., Bertini, M., & Capineri, L. (2024). Deep Learning-Based Real-Time Detection of Surface Landmines Using Optical Imaging. Remote Sensing, 16(4), 677. DOI: https://doi.org/10.3390/rs16040677.en
dc.relation.referencesBaur, J., Dewey, K., Steinberg, G., & Nitsche, F.O. (2024). Modeling the Effect of Vegetation Coverage on UAV-Based Object Detection: A Study in the Minefield Environment. Remote Sensing, 16(12), 2046. DOI: https://doi.org/10.3390/rs16122046.en
dc.relation.referencesStankevich, S.A., & Saprykin, I.Y. (2024). Optical and Magnetometric Data Integration for Landmine Detection with UAV. WSEAS Trans. on Environment and Development, 20(96), 1059–1066. DOI: https://doi.org/10.37394/232015.2024.20.96.en
dc.relation.referencesBarnawi, A., Kumar, K., Kumar, N., Alzahrani, B., & Almansour, A. (2024). A Deep Learning Approach for Landmines Detection Based on Airborne Magnetometry Imaging and Edge Computing. Comput. Modeling in Eng. & Sci., 139(2), 2117–2137. DOI: https://doi.org/10.32604/cmes.2023.044184.en
dc.relation.referencesMentus, I. (2024). Remote Sensing for Humanitarian Demining: A Review of Methods and Challenges. Journal of Mine Action, 24(1), 10–21. (Присвячено відсутності універсального методу, компромісам безпека/ефективність).en
dc.relation.referencesKovács, L., & Ember, E. (2022). Survey of UAV-Based Explosive Threat Detection. IEEE Access, 10, 99365–99381. DOI: https://doi.org/10.1109/ACCESS.2022.3205034 (Наголошено на відсутності універсального методу, потребі комбінувати сенсори).en
dc.relation.referencesArduPilot Dev Team (2024). Mission Planning and Rewind on Resume – ArduPilot Copter Documentation. (Доступно за адресою https://ardupilot.org/copter/docs/common-planning-a-mission).en
dc.relation.referencesMAVLink Community (2025). MAVLink Developer Guide – MAVLink v2 Documentation. (Доступно за адресою https://mavlink.io/en/).en
dc.relation.referencesOpenAI (2024). GPT-4V(ision) System Card. (OpenAI Technical Report, Sep 2024). (Опис можливостей GPT-4.1 Vision, обмеження та пропускна здатність API).en
dc.relation.referencesGoogle DeepMind (2025). Gemini 2.5 Flash Model Card. (DeepMind Model Release, Mar 2025). (Характеристики Gemini 2.5 Flash: мультимодальність, контекст 1M, оптимізація latency/cost).en
dc.relation.referencesRobotko, S., & Topalov, A. (2025). Multilevel UAV Architecture for Mine Detection: Integration of Vision, Metal Sensing and AI. Preprint arXiv:2511.12345. (Описано архітектуру edge→ground→cloud з YOLOv8, ChatGPT-4Vision та металодетектором, експерименти на макетах мін).en
dc.relation.referencesMonk, S. (2023). Raspberry Pi Cookbook: Software and Hardware Problems and Solutions (4th Ed.). O’Reilly Media. (Практичні рецепти для реалізації бортових застосунків на Raspberry Pi).en
dc.identifier.doihttps://doi.org/10.31649/1681-7893-2025-50-2-114-124


Файли в цьому документі

Thumbnail

Даний документ включений в наступну(і) колекцію(ї)

Показати скорочену інформацію