Оптимізація мереж 5G засобами штучного інтелекту
Author
Васильківський, М. В.
Грабчак, Н. В.
Антонюк, М. І.
Vasylkivskyi, M.
Hrabchak, N.
Antonyuk, M.
Date
2026Metadata
Show full item recordCollections
Abstract
This work investigates modern methods for enhancing the performance of artificial intelligence algorithms
executed directly on mobile and embedded devices. Specialized optimization approaches are considered, including layer-wise profiling, efficient execution of convolution operations using General Matrix Multiplication
(GEMM), operator fusion to reduce memory accesses, low-precision computations (FP16, INT8), and memory
usage optimization through liveness analysis and shared memory pools. The advantages of integrating modern
deep learning architectures, such as Transformers and generative models (GANs), for network parameter prediction and training data synthesis are explored. Conclusions are drawn regarding improved inference speed,
reduced memory footprint and energy consumption, and enhanced efficiency in utilizing GPU and AI accelerator resources. У роботі досліджено сучасні методи підвищення продуктивності алгоритмів штучного інтелекту,
що виконуються безпосередньо на мобільних та вбудованих пристроях. Розглянуто спеціалізовані підходи до оптимізації, включаючи layer-wise профілювання, ефективне виконання операцій згортки через
General Matrix Multiplication (GEMM), operator fusion для зменшення звернень до пам’яті, низькоточні
обчислення (FP16, INT8) та оптимізацію використання оперативної пам’яті за допомогою liveness
analysis і спільних пулів пам’яті. Досліджено переваги інтеграції сучасних архітектур глибокого навчання, таких як Transformer та генеративні моделі (GAN), для прогнозування параметрів мереж і синтезу
навчальних даних. Зроблено висновки щодо підвищення швидкодії інференсу, скорочення обсягів пам’яті
та енергоспоживання, а також покращення ефективності використання обчислювальних ресурсів GPU
та апаратних прискорювачів AI.
URI:
https://ir.lib.vntu.edu.ua//handle/123456789/51339

