Адаптаційне управління показом рекламних роликів в соціальних мережах за схемою багаторукого бандита
Abstract
За мінливого маркетингового середовища для успіху рекламної кампанії необхідно
максимально скоротити час від ідеї реклами до реалізації комунікації. Постає необхідність
одночасного і рекламування, і досліджень, і корегування комунікаційних процесів. Відповідно,
потрібно приймати деяку послідовність рішень, сукупність яких забезпечують коректний
баланс між етапами тестування та запуску. Одним із найбільш зручних для практичної
реалізації адаптаційних механізмів є схема дворукого бандита. Дворукий бандит це модель
багатократного вибору однієї із двох альтернатив з апріорі невідомим розподілом виграшу
між ними. Кожна альтернатива асоціюється з однією рукою бандита. За наслідками
прийнятих рішень ймовірносний розподіл виграшів поступово ідентифікується і
використовується в подальшому для експлуатації кращої альтернативи. На практиці
альтернатив може бути і більше, тоді задача багатократного прийняття рішень зводиться
до моделі багаторукого бандита. Запропонована нова модель управління показом рекламних
роликів в соціальних мережах за принципами багаторукого бандита. Ідея полягає в тому,
одночасно демонструється кілька рекламних роликів, частота показу кожного із яких
залежить від результативності – від рівня утримання глядачів до контактного кадра. На
основі показників утримання між роликами щодобово перерозподіляються деяка частка
ресурсів. Запропоновані прості та ефективні формули для перерозподілу ресурсів, які
враховують як поточну нерівномірність показників утримання, так і статистику
демонстрацій роликів. Здійснено моделювання управління показом протягом 35 діб для трьох
рекламних роликів. Продемонстрована робота моделі управління як за стаціонарних умов, так
і за умов вкиду вірусного повідомлення. На фазових траєкторіях продемонстровано як
змінюється реакція системи на вкид вірусного повідомлення за різних параметрів управління. In a rapidly changing marketing environment, to ensure the success of an advertising campaign, it is necessary to
minimize the time from the idea of advertising to the implementation of communication. There is a need for simultaneous
advertising, study and adjustment of communication processes. Accordingly, it is necessary to make a certain sequence of
decisions, the sum of which ensures the right balance between learning and earning. One of the most convenient adaptation
mechanisms for practical implementation is the two-armed bandit scheme. A two-armed bandit is a model of multiple
choices of one of two alternatives with an a priori unknown distribution of payoffs between them. Each alternative is
associated with one arm of the bandit. As a result of the choices made, the probabilistic distribution of payoffs is identified
by step to step and used to exploit the best alternative. In practice, there may be more alternatives, in which case the multiple
decision problem is maped to the multi-armed bandit scheme. A new multi-armed bandit-based model for advertising
control in social networks is proposed. The idea is that multiple advertisements are displayed simultaneously, and the
frequency of display of each depends on its performance - from the level of viewer retention to the contact frame. Based on
the retention rates, a certain share of resources is redistributed among the commercials on a daily basis. Simple and
effective formulas for the reassignment of resources are proposed, taking into account both the current unevenness of retention rates and the statistics of video demonstrations. A simulation of the control model for a 35-day campaign for three commercials is performed. The performance of the control model is demonstrated both under steady-state conditions and in the case of a viral message insertion. The phase trajectories show how the response of the system to the insertion of a viral message changes with different control parameters.
URI:
https://ir.lib.vntu.edu.ua//handle/123456789/42560