Інформаційна технологія аналізу та прогнозування кількості нових випадків захворювань на коронавірус ARS-CоV-2 в Україні на основі моделі Prophet
Автор
Мокін, В. Б.
Лосенко, А. В.
Ящолт, А. Р.
Mokin, V. B.
Losenko, A. V.
Yasсholt, A. R.
Мокин, В. Б.
Лосенко, А. В.
Ящолт, А. Р.
Дата
2020Metadata
Показати повну інформаціюCollections
Анотації
Розроблено інформаційну технологію аналізу та прогнозування кількості нових підтверджених випадків захворювань на коронавірус «COVID-19», викликаних інфекцією SARS-CoV-2, на прикладі щодобових сумарних по Україні даних поточної «хвилі» з урахуванням різних свят і псевдосвят, які можуть мати аномальний вплив. Проведено огляд відомих моделей для врахування таких аномалій та обґрунтовано, що за сучасних коротких рядів даних спостережень та інших умов оптимальною для розв’язання цієї задачі є модель Facebook Prophet. Охарактеризовано наявні дані щодо можливих часо-вих аномалій по Україні у відомому датасеті Google-платформи «COVID-19 Open Data» та запропоно-вано яким чином можна адаптивно враховувати такі аномалії, як: державні свята, дати, коли за да-ними NOAA було дуже тепло і не було опадів та дати послаблення карантину за інформацією з «Oxford COVID-19 government response tracker». Розроблено алгоритм застосування запропонованої інформаційної технології з двоетапною ідентифікацією параметрів та окремим валідаційним датасетом для ідентифікації оптимальної структури моделі на кожному з цих етапів. Створено програмне забезпечення на Python на базі платформи Kaggle, яке застосовано, як для України, так і ще для 69 країн світу. Для прискорення роботи, по-перше, розроблено спрощену версію моделі лише з одним етапом її ідентифікації, а по-друге, створено новий датасет «COVID-19: Holidays of countries» з інформацією про свята 70 країн світу, адаптований до потреб цієї технології та розміщений у Kaggle у форматі відкритих даних. За допомогою ідентифікованих моделей отримано низку важливих висновків щодо розуміння закономірностей поширення коронавірусу як в Україні, так і в інших 69 країнах світу. Побудовано модель, яка забезпечує моделювання кількості нових підтверджених випадків захворювань на коронавірус в Україні на 2 тижні вперед з похибкою 2,2 % та зроблено прогноз на наступні 2 тижні, який передано у Робочу групу з математичного моделювання проблем, пов’язаних з епідемією коронавірусу SARS-CoV-2 в Україні. The article describes the development of information technology for analysis and forecasting of amount of new confirmed
cases of the disease for coronavirus "COVID-19" caused by SARS-CoV-2 infection, based on the daily summary data
of the current “wave” in Ukraine, and taking into account various holidays and pseudo-holidays. A review of the known models,
which acknowledge such anomalies, was conducted and it is substantiated that considering the current short series of
observational data and other conditions, the Facebook Prophet model is optimal for solving this problem. Available data on
possible time anomalies in Ukraine in the well-known dataset "COVID-19 Open Data" from Google was characterized, and it
is proposed how to take into consideration such anomalies as: public holidays, dates when accordingly to NOAA data
weather was warm and without any precipitation, and dates of quarantine easing using information from the "Oxford COVID-
19 government response tracker". An algorithm for usage of the proposed information technology was developed, which
included a step of two-stage parameter identification and used a separate validation dataset to identify the optimal structure
of the model at each stage. Software using Python was created and displayed on Kaggle platform, which then was applied
both for Ukraine and for 69 countries around the world. To speed up the research firstly the simplified version of the model
was developed with only one stage of parameter identification, and secondly that a dataset "COVID-19: Holidays of countries"
was compiled, with information about the holidays of 70 countries, adapted to the needs of this technology and was
saved on Kaggle as an open dataset. With the help of the identified models, a number of important conclusions were obtained
regarding the understanding of the patterns of coronavirus spread both in Ukraine and in 69 other countries of the
world. A model was built to calculate the number of possible new confirmed cases of coronavirus in Ukraine for the next 2
weeks with an error of 2,2 % and using this model, a forecast for the next 2 weeks was made, which was submitted to the
Research Group of Mathematical Modeling of Problems Related to the SARS-CoV-2 Epidemic in Ukraine. Разработана информационная технология анализа и прогнозирования количества новых подтвержденных
случаев заболевания на коронавирус «COVID-19», вызванного инфекцией SARS-CoV-2, на примере ежесуточных
суммарных по Украине данных текущей «волны» с учетом различных праздников и псевдо праздников, которые
могут иметь аномальное влияние. Проведен обзор известных моделей для учета таких аномалий и обосновано,
что при современных коротких рядах данных наблюдений и других условий оптимальной для решения этой зада-
чи является модель Facebook Prophet. Охарактеризованы имеющиеся данные о возможных временных аномалиях
по Украине в известном датасете Google-платформы «COVID-19 Open Data» и предложено каким образом можно
адаптивно учитывать такие аномалии, как: государственные праздники, даты, когда по данным NOAA было
очень тепло и не было осадков и даты послабления карантина по информации из «Oxford COVID-19 government
response tracker». Разработан алгоритм применения предложенной информационной технологии с двухэтапной
идентификацией параметров и отдельным валидационным датасетом для идентификации оптимальной
структуры модели на каждом из этих этапов. Создано программное обеспечение на Python на базе платформы
Kaggle, которое применено, как для Украины, так и еще для 69 стран мира. Для ускорения работы, во-первых,
разработана упрощенная версия модели только с одним этапом ее идентификации, а во-вторых, создан новый
датасет «COVID-19: Holidays of countries» с информацией о праздниках 70 стран мира, адаптированный к по-
требностям этой технологии и расположенный в Kaggle в формате открытых данных. С помощью идентифи-
цированных моделей получен ряд важных выводов относительно понимания закономерностей распространения
коронавируса как в Украине, так и в других 69 странах мира. Построена модель, которая обеспечивает модели-
рование количества новых подтвержденных случаев заболевания коронавирусом в Украине на 2 недели вперед с
погрешностью 2,2 % и сделан прогноз на следующие 2 недели, который передан в Рабочую группу по математи-
ческому моделированию проблем, связанных с эпидемией коронавируса SARS-CoV-2 в Украине.
URI:
http://ir.lib.vntu.edu.ua//handle/123456789/31308