Моделювання системи збору новинного контенту для аналізу риторики публічних осіб
Abstract
У роботі проведено порівняльний аналіз двох основних підходів до збирання новинного контенту – пакетної та потокової моделі. Здійснено вибір оптимальної моделі з урахуванням затримки, повноти даних і навантаження на систему. На основі формалізованих критеріїв доведено доцільність використання batchмоделі в задачах із невисокою частотою оновлення новин. Представлено аналітичну формулу зваженої ефективності моделі, що дозволяє адаптивно обирати архітектурне рішення під конкретні потреби системи моніторингу публічної риторики. This work presents a comparative analysis of two common approaches to collecting news content: batch and stream models. Based on latency, data completeness, and system load, the batch model was identified as optimal for lowfrequency update tasks. A weighted effectiveness criterion was proposed, which allows selecting an architectural solution adapted to public rhetoric monitoring systems.
URI:
https://ir.lib.vntu.edu.ua//handle/123456789/48109

