Вплив логарифмічної трансформації вхідних активацій у згорткових мережах на локалізацію ключових точок обличчя

Тарновський, А. М.; Захарченко, С. М.; Тарновський, М. Г.; Tarnovskyi, A. M.; Zakharchenko, S. M.; Tarnovskyi, M. G.

Автор

Тарновський, А. М.

Захарченко, С. М.

Тарновський, М. Г.

Tarnovskyi, A. M.

Zakharchenko, S. M.

Tarnovskyi, M. G.

Дата

2026

Metadata

Показати повну інформацію

Collections

JetIQ [284]

Анотації

The paper considers the application of the logarithmic perception principle in convolutional neural network models, according to which the system&039;s response is determined by relative signal changes. Within this approach, the impact of logarithmic transformation of input activations in the first convolutional layer on facial landmark localization accuracy and model robustness to brightness variations is investigated. Experimental validation on the WFLW dataset using the ResNet-34 architecture demonstrated that such a transformation does not significantly affect localization accuracy under normal brightness conditions; however, it slightly increases the model&039;s robustness to illumination decrease. Specifically, it was found that applying logarithmic transformation reduces the Normalized Mean Error (NME) compared to the baseline model by an average of 0.0019 for a threefold decrease in brightness and by 0.0071 for a sixfold decrease. Thus, the logarithmic transformation of input activations can be considered a tool for enhancing the robustness of convolutional neural networks to input signal intensity variations without increasing their architectural complexity.

У роботі розглянуто застосування в моделях згорткових нейронних мереж принципу логарифмічного сприйняття, згідно з яким реакція системи визначається відносними змінами сигналу. У межах цього підходу досліджено вплив логарифмічної трансформації вхідних активацій нейронів першого згорткового шару на точність локалізації ключових точок обличчя та стійкість моделі до варіацій яскравості зображень. Експериментальна перевірка на наборі даних WFLW з використанням архітектури ResNet-34 показала, що така трансформація не має значного впливу на точність локалізації ключових точок на зображеннях з нормальною яскравістю, однак дещо підвищує стійкість моделі до її зниження. Зокрема, встановлено, що застосування логарифмічної трансформації дозволяє знизити значення нормалізованої середньої похибки NME порівняно з базовою моделлю в середньому на 0,0019 при трикратному та на 0,0071 при шестикратному зменшенні яскравості. Отже, логарифмічна трансформація вхідних активацій може розглядатися як один з інструментів підвищення стійкості згорткових нейронних мереж до змін інтенсивності вхідних сигналів без ускладнення їхньої архітектури.

URI:

https://ir.lib.vntu.edu.ua//handle/123456789/52135

Відкрити

205152.pdf (518.9Kb)