Інтелектуальний метод з підкріпленням синтезу оптимального конвеєру операцій попереднього оброблення даних у задачах машинного навчання
Abstract
Стаття присвячена синтезу та оптимізації конвеєрів операцій попереднього оброблення у задачах побудови моделей машинного навчання. Зазначено, що важливо оптимізувати всю тріаду цих конвеєрів – вибрати оптимальну послідовність оптимальних операцій з оптимальними параметрами. І при цьому, зміна хоча б одного елемента одразу впливає на вибір усіх інших елементів та їх параметрів. У загальному випадку існує велика кількість допустимих варіантів таких конвеєрів для кожної моделі машинного навчання та вхідних даних (випадкових величин чи часових рядів) і, при цьому, як правило, не існує розмічених датасетів для тренування моделі для синтезу таких конвеєрів. Зроблено огляд відомих підходів до розв’язання таких задач та обґрунтовано висновок про те, що найкраще їх формалізувати як задачі машинного навчання з підкріпленням. Наведено типові підходи з формалізації та інтелектуальні методи розв’язання подібних задач.
Зазначено, що розв’язання задач з підкріпленням, як правило, ускладнено великою розмірністю можливих множин типів та підтипів операцій з різними параметрами і має значні проблеми зі збіжністю до дійсно оптимального значення за обмежений час. А тому запропоновано декілька удосконалень, які дозволять, за певних умов, вирішити цю проблему. По-перше, запропоновано виділяти змінну та незмінні ланки конвеєра операцій попереднього оброблення. Запропоновано для різних типів моделей машинного навчання які операції варто віднести до першої та останньої незмінних ланок, а які – до змінної ланки і тільки до неї запропоновано застосовувати навчання з підкріпленням. А по-друге, запропоновано алгоритм початкового налаштування параметрів RL-політики, залежно від певних статистичних та інших характеристик вхідних даних. Запропоноване удосконалення методу з підкріпленням синтезу оптимального конвеєра операцій може бути застосовано не тільки для операцій попереднього оброблення, а й до інших задач з подібною формалізацією даних та постановкою задачі.
URI:
http://ir.lib.vntu.edu.ua//handle/123456789/36450