Інформаційна технологія аналізу та прогнозування багатохвильової кількості нових випадків захворювань на коронавірус COVID-19 на основі моделі Prophet
Автор
Мокін, В. Б.
Лосенко, А. В.
Ящолт, А. Р.
Mokin, V. B.
Losenko, A. V.
Yasсholt, A. R.
Мокин, В. Б.
Лосенко, А. В.
Ящолт, А. Р.
Дата
2020Metadata
Показати повну інформаціюCollections
Анотації
Удосконалено раніше розроблену авторами інформаційну технологію аналізу та прогнозування кількості нових підтверджених випадків захворювань на коронавірус COVID-19, викликаною інфекцією SARS-CoV-2, на прикладі щодобових сумарних по Україні даних поточної «хвилі» з урахуванням різних свят і псевдосвят, які можуть мати аномальний вплив. Створена раніше технологія була працездатною лише для ділянки невпинного зростання значень однієї хвилі, а удосконалена вже може застосовуватись для аналізу та прогнозування даних протягом усього періоду, оскільки враховує багатохвильову природу цього явища. Запропоновано алгоритм ідентифікації параметрів кожної хвилі. Розроблено низку математичних співвідношень, які дозволяють у першому наближенні оцінити дату початку, завершення та період кожної хвилі, навіть за випадку, коли одна хвиля переходить в іншу.
Запропоновані нові емпіричні співвідношення для оцінювання порядку ряду Фур’є для опису коливального процесу кожної хвилі лише по 10 % її значень у верхівці, оскільки, зазвичай, такі дані є в явному ви-гляді, інакше дані не будуть розпізнані як окрема хвиля. Співвідношення виведені окремо для випадку лише додатних коефіцієнтів, коли пік розташований ліворуч від середини напівперіоду, і окремо — для випадку знакозмінного ряду, коли пік розташований праворуч від неї. Однак, ці наближені оцінки рекоме-ндовано уточнювати у певному діапазоні можливих значень, оскільки, в загальному випадку різних варіа-нтів значень амплітуди гармонік запропоновані співвідношення можуть давати занижені оцінки.
Запропоновано застосовувати ідентифіковану за цією технологією модель для прогнозування найпесимістичнішого та найоптимістичнішого сценаріїв розвитку явища, тобто зміни кількості нових підтверджених випадків захворювань на коронавірус COVID-19 у майбутньому у заданій країні.
Створено програмне забезпечення на Python на базі платформи Kaggle, яке застосовано, як для України, так і ще для 69 країн світу. За допомогою ідентифікованих моделей отримано низку важливих висновків щодо розуміння закономірностей поширення коронавірусу як в Україні, так і в інших 69 країнах світу. Результати передано у Робочу групу з математичного моделювання проблем, пов’язаних з епідемією коронавірусу SARS-CoV-2 в Україні. The article is devoted to the improvement of the information technology previously developed by the authors for the analysis and forecasting of the number of new confirmed cases of the disease for the coronavirus COVID-19 caused by the SARS-CoV-2 infection, using the example of the daily total data of the current "wave" in Ukraine, taking into account various holidays and pseudo-holydays, which may have an abnormal effect. The previously created technology was operable only for the area of continuous growth of the values of one wave, and the improved one can already be used to analyze and predict data throughout the entire period, since it takes into account the multi-wave nature of this phenomenon. An algorithm for identifying the parameters of each wave is proposed. A number of mathematical relationships have been developed that allow, in a first approximation, to estimate the start, end and period of each wave, even in the case when one wave passes into another.
A new empirical relationships is proposed to estimate the order of the Fourier series for describing the time process of each wave for only 10 % of its values at the top, since, as a rule, such data are available in an explicit form, otherwise the data will not be recognized as a separate wave. The ratios are derived separately for the case of only positive coefficients, when the peak is located to the left of the middle of the half-period, and separately — for the case of an alternating series, when the peak is located to the right of it. However, these approximate estimates are recommended to be refined within a certain range of possible values, since in the general case of different variants of the harmonic amplitude values, the pro-posed ratios can give underestimates.
It is proposed to apply the model identified by this technology to predict the most pessimistic and most optimistic scenar-ios for the development of the phenomenon, that is, changes in the number of new confirmed cases of the disease for the coronavirus COVID-19 in the future in a given country.
Python software was created based on the Kaggle platform, which is used both for Ukraine and for 69 other countries. Using the identified models, a number of important conclusions were obtained regarding understanding the patterns of the spread of coronavirus both in Ukraine and in other 69 countries of the world. The results were submitted to the Working Group on Mathematical Modeling of Problems Associated with the SARS-CoV-2 Coronavirus Epidemic in Ukraine. Усовершенствована ранее разработанная авторами информационная технология анализа и прогнози-рования количества новых подтвержденных случаев заболеваний коронавирусом COVID-19, вызванных инфекци-ей SARS-CoV-2, на примере ежесуточных суммарных по Украине данных текущей «волны» с учетом различных праздников и псевдопраздников, которые могут иметь аномальное влияние. Созданная ранее технология была работоспособной только для участка непрерывного роста значений одной волны, а усовершенствованная уже может использоваться для анализа и прогнозирования данных в течение всего периода, поскольку учитывает многоволновую природу этого явления. Предложен алгоритм идентификации параметров каждой волны. Разра-ботан ряд математических соотношений, которые позволяют в первом приближении оценить дату начала, завершения и период каждой волны, даже в случае, когда одна волна переходит в другую.
Предложены новые эмпирические соотношения для оценки порядка ряда Фурье для описания колебательного процесса каждой волны лишь по 10 % ее значений в вершине, поскольку, как правило, такие данные есть в явном виде, иначе данные не будут распознаны как отдельная волна. Соотношения выведены отдельно для случая только положительных коэффициентов, когда пик расположен слева от середины полупериода, и отдельно — для случая знакопеременного ряда, когда пик расположен справа от нее. Однако, эти приблизительные оценки рекомендовано уточнять в определенном диапазоне возможных значений, поскольку в общем случае различных вариантов значений амплитуды гармоник предложенные соотношения могут давать заниженные оценки.
Предложено применить идентифицированную по этой технологии модель для прогнозирования наиболее пессимистичного и оптимистичного сценариев развития явления, то есть изменения количества новых под-твержденных случаев заболеваний коронавирусом COVID-19 в будущем в заданной стране.
Создано программное обеспечение на Python на базе платформы Kaggle, которое применено как для Украины, так и еще для 69 стран мира. С помощью идентифицированных моделей получен ряд важных выводов относи-тельно понимания закономерностей распространения коронавируса как в Украине, так и в других 69 странах мира. Результаты переданы в Рабочую группу по математическому моделированию проблем, связанных с эпи-демией коронавируса SARS-CoV-2 в Украине.
URI:
http://ir.lib.vntu.edu.ua//handle/123456789/31715