• English
    • українська
  • українська 
    • English
    • українська
  • Увійти
Дивитися документ 
  • Головна
  • Науково-технічна бібліотека
  • Публікації співробітників бібліотеки
  • JetIQ
  • Дивитися документ
  • Головна
  • Науково-технічна бібліотека
  • Публікації співробітників бібліотеки
  • JetIQ
  • Дивитися документ
Сайт інституційного репозитарію ВНТУ містить роботи, матеріали та файли, які були розміщені докторантами, аспірантами та студентами Вінницького Національного Технічного Університету. Для розширення функцій сайту рекомендується увімкнути JavaScript.

Інформаційна технологія розпізнавання та локалізації об’єктів на основі слабоконтрольованого навчання: огляд задач і методів

Автор
Зелений, В. Є.
Козловський, А. В.
Zelenyi, V. Ye.
Kozlovskyi, A. V.
Дата
2025
Metadata
Показати повну інформацію
Collections
  • JetIQ [120]
Анотації
In modern period , marked by the exponential growth of digital data and computing resources, the search for reliable object recognition and localization systems has become an increasingly important task in many fields, covering industrial automation, healthcare automation, environmental monitoring, etc. Traditionally, the development of such a system has relied heavily on the acquisition and processing of large datasets annotated with ground-truth labels, a labor-intensive and costly manual process. However, the paradigmatic form of weakly supervised learning (WSL) has catalyzed a profound transformation in this landscape, offering a compelling alternative way by which machine learning models can be trained on less precise or ambiguous forms of supervision. Abandoning the strict view inherent in WSL not only eases the burdensome annotation process, but also extends the scope of machine learning techniques to scenarios where obtaining accurate annotations is impractical, too expensive, or simply impossible. This shift in perspective has sparked a renaissance in information technology research and innovation, sparking a surge of interest and investment in harnessing the resulting potential of weak signals observed to enhance object recognition and localization capabilities. The evolution of WSL in IT heralds a paradigm shift in how we design, develop, and deploy intelligent systems across a wide range of real-world applications. By enabling machines to acquire meaningful information about imperfect or incomplete surveillance signals, WSL not only enables object recognition and localization system efficiency and scalability, but also improves adaptability and resilience to the shape of landscape data and evolving application areas. Thus, the convergence of WSL and IT is poised to revolutionize the very fabric of modern computing, ushering in an era augmented by unprecedented opportunities, possibilities, and opportunities for innovation and discovery. In the field of unsupervised learning for object recognition and localization, several current challenges persist that hinder its effectiveness and adoption. Ambiguous and noisy weak signals observed often hamper the performance of the models, which reduces the accuracy of localization scale and difficulty. In addition, the semantic gap and conceptual drift create significant obstacles, affecting the adaptability and relevance of WSL models over time. Ethical and societal research, including equity and transparency issues, will further complement the framework for deploying WSL in real-world applications. Solving these problems requires improved robustness to noisy signals, improved localization accuracy, scalability, generalizability, and ethical considerations. By addressing these issues, WSL can reach its full potential and pave the way for more reliable and ethically sound intelligent systems. The article considers the prospects for further research in the field of weakly controlled learning. An overview of current approaches to object recognition and localization based on weakly supervised learning (WSL) is presented. Key challenges of WSL – limited annotations, coarse labels, and data noise – are analyzed, and an integrated approach for addressing these issues is described. The proposed approach combines improved data preprocessing, adaptive loss functions accounting for uncertainty, data augmentation, integration of domain-specific knowledge, and self-training strategies. The novelty of this combination is substantiated, and a theoretical possibility of at least 0.1% improvement in model quality over known solutions is shown. A comparative analysis of existing methods (including the state-of-the-art SAM segmentation model) is provided, highlighting the advantages of the proposed approach.
 
У сучасну епоху, позначену експоненційним зростанням цифрових даних і обчислювальних ресурсів, пошук надійних систем розпізнавання об’єктів і локалізації стає дедалі важливішим завданням у безлічі областей, охоплюючи промислову автоматизацію, діагностику охорони здоров’я, моніторинг навколишнього середовища тощо. Традиційно розробка таких систем значною мірою покладалася на отримання та обробку великих наборів даних, ретельно анотованих базовими мітками істинності, процес, пов’язаний з кропіткою ручною роботою та значними фінансовими витратами. Проте парадигматична поява слабоконтрольованого навчання (WSL) стала каталізатором глибокої трансформації в цьому ландшафті, пропонуючи переконливий альтернативний шлях, за допомогою якого моделі машинного навчання можуть навчатися на менш точних або неоднозначних формах супервізії. Відмова від суворого контролю, притаманна WSL, не тільки полегшує обтяжливий процес анотування, але й розширює сферу застосування методів машинного навчання до сценаріїв, де отримання точних анотацій є непрактичним, занадто дорогим або просто неможливим. Цей зсув у перспективі викликав ренесанс у дослідженнях та інноваціях у сфері інформаційних технологій, викликавши сплеск інтересу та інвестицій, спрямованих на використання прихованого потенціалу слабких сигналів спостереження для посилення можливостей розпізнавання об’єктів і локалізації. Еволюція WSL в ІТ передбачає зміну парадигми в тому, як ми створюємо, розробляємо та розгортаємо інтелектуальні системи в широкому спектрі реальних додатків. Дозволяючи машинам отримувати значущу інформацію з недосконалих або неповних сигналів контролю, WSL не тільки підвищує ефективність і масштабованість систем розпізнавання об’єктів і локалізації, але також сприяє адаптивності та стійкості щодо ландшафтів даних і областей додатків, що розвиваються. Таким чином, конвергенція WSL та ІТ готова революціонізувати саму основу сучасних обчислень, відкриваючи еру, яка визначається безпрецедентними можливостями для інновацій та відкриттів. У сфері слабоконтрольованого навчання для розпізнавання та локалізації об’єктів зберігається кілька сучасних проблем, які перешкоджають його ефективності та прийняттю. Неоднозначні та шумні слабкі сигнали спостереження часто перешкоджають продуктивності моделі, що обмежує точність локалізації та викликає проблеми масштабованості. До того ж, семантичний розрив і дрейф концепції створюють значні перешкоди, впливаючи на адаптивність і релевантність моделей WSL з часом. Етичні та суспільні наслідки, зокрема проблеми справедливості та прозорості, ще більше ускладнюють розгортання систем WSL у реальних програмах. Вирішення цих проблем потребує вдосконалення стійкості до зашумлених сигналів, покращення точності локалізації, масштабованості, узагальнення та етичних міркувань. Вирішуючи ці проблеми, WSL може повністю розкрити свій потенціал і прокласти шлях до надійніших і етично обґрунтованіших інтелектуальних систем. У статті подано огляд сучасних підходів до розпізнавання та локалізації об’єктів на основі слабоконтрольованого навчання. Проаналізовано основні проблеми WSL: обмежена анотація даних, нечіткі мітки та шум у даних, – та описано інтегрований підхід для їхнього подолання. Запропонований підхід поєднує вдосконалену попередню обробку даних, адаптивні функції втрат з урахуванням невизначеності, розширення даних, інтеграцію предметно-орієнтованих знань і стратегій самонавчання. Обґрунтовано наукову новизну такого поєднання та теоретично показано можливість підвищення якості моделі щонайменше на 0,1 % у порівнянні з відомими рішеннями. Наведено порівняльний аналіз наявних методів (зокрема сучасної сегментаційної моделі SAM) та окреслено переваги запропонованого підходу.
 
URI:
https://ir.lib.vntu.edu.ua//handle/123456789/49078
Відкрити
185370.pdf (570.0Kb)

Інституційний репозиторій

ГоловнаПошукДовідкаКонтактиПро нас

Ресурси

JetIQСайт бібліотекиСайт університетаЕлектронний каталог ВНТУ

Перегляд

Всі архівиСпільноти та колекціїЗа датою публікаціїАвторамиНазвамиТемамиТипВидавництвоМоваУДКISSNВидання, що міститьDOIЦя колекціяЗа датою публікаціїАвторамиНазвамиТемамиТипВидавництвоМоваУДКISSNВидання, що міститьDOI

Мій обліковий запис

ВхідРеєстрація

Статистика

View Usage Statistics

ISSN 2413-6360 | Головна | Відправити відгук | Довідка | Контакти | Про нас
© 2016 Vinnytsia National Technical University | Extra plugins code by VNTU Linuxoids | Powered by DSpace
Працює за підтримки 
НТБ ВНТУ