Neural network architecture for real-time QR code recognition
Автор
Serediuk, Hlib
Garmash, Vladimir
Гармаш, В. В.
Дата
2024Metadata
Показати повну інформаціюCollections
- JetIQ [334]
Анотації
The study investigated modern neural network architectures for efficient real-time recognition of QR codes, which is critical for the development of mobile applications and industrial control systems. The study analysed the features of using light convolutional neural networks optimised for operation on mobile devices with limited computing resources. A modified architecture was proposed that strikes a balance between speed and accuracy when processing a video stream, achieving a recognition rate of 30 frames per second on standard mobile processors. A multi-stage decision-making mechanism based on the Early Stopping Mechanism (ESM) has been developed to optimise image processing. An adaptive filtering method using a median filter and morphological reconstruction was implemented, which substantially improved the quality of input data. The proposed architecture included a specialised preprocessing module and a system of residual-and-excitation blocks to improve recognition efficiency. Experimental studies demonstrated a 12-15% increase in the system`s real-time performance compared to the baseline models when processing a video stream. The system successfully recognised QR codes in poor lighting conditions and non-standard tilt angles with an accuracy of over 92%. A 27% reduction in computational complexity was achieved while maintaining high recognition accuracy. The developed method efficiently processes images with geometric distortions even in conditions of limited resources. The study developed the theoretical foundations of optimising convolutional neural networks for computer vision tasks, offering new approaches to balancing recognition efficiency and accuracy. The practical significance of the study was confirmed by the possibility of direct integration of the developed system into mobile applications and industrial quality control systems, while the proposed optimisation methods can be adapted to a wide range of computer vision tasks on mobile platforms У статті досліджуються сучасні архітектури нейронних мереж для ефективного розпізнавання QR-кодів у реальному часі, що є критично важливим для розвитку мобільних застосунків та промислових систем контролю. Проаналізовано особливості застосування легких згорткових нейронних мереж, оптимізованих для роботи на мобільних пристроях з обмеженими обчислювальними ресурсами. Запропоновано модифіковану архітектуру, що забезпечує баланс між швидкодією та точністю при обробці відеопотоку, досягаючи частоти розпізнавання 30 кадрів на секунду на стандартних мобільних процесорах. Розроблено багатоетапний механізм прийняття рішень на основі ESM (Early Stopping Mechanism), який оптимізує процес обробки зображень. Впроваджено адаптивний метод фільтрації з використанням медіанного фільтру та морфологічної реконструкції, що суттєво підвищує якість вхідних даних. Запропонована архітектура містить спеціалізований модуль попередньої обробки та систему residual-and-excitation блоків для підвищення ефективності розпізнавання. Експериментальні дослідження демонструють підвищення ефективності роботи системи в реальному часі на 12–15 % порівняно з базовими моделями при обробці відеопотоку. Система успішно розпізнає QR-коди при складному освітленні та нестандартних кутах нахилу з точністю понад 92 %. Досягнуто зменшення обчислювальної складності на 27 % при збереженні високої точності розпізнавання. Розроблений метод ефективно обробляє зображення з геометричними спотвореннями навіть в умовах обмежених ресурсів. Дослідження розвиває теоретичні засади оптимізації згорткових нейронних мереж для задач комп’ютерного зору, пропонуючи нові підходи до балансування ефективності та точності розпізнавання. Практична значущість роботи підтверджується можливістю безпосередньої інтеграції розробленої системи в мобільні додатки та промислові системи контролю якості, а запропоновані методи оптимізації можуть бути адаптовані для широкого спектру задач комп’ютерного зору на мобільних платформах
URI:
https://ir.lib.vntu.edu.ua//handle/123456789/46223