dc.contributor.author | Шмундяк, Д. О. | uk |
dc.contributor.author | Мокін, В. Б. | uk |
dc.contributor.author | Shmundiak, D. | en |
dc.contributor.author | Mokin, V. | en |
dc.date.accessioned | 2024-06-24T07:49:35Z | |
dc.date.available | 2024-06-24T07:49:35Z | |
dc.date.issued | 2023 | |
dc.identifier.citation | Шмундяк Д. О. Метод ідентифікації параметрів гармонік та аномалій періодичного часового ряду на основі адаптивної декомпозиції [Текст] / Д. О. Шмундяк, В. Б. Мокін // Вісник Вінницького політехнічного інституту. – 2023. – № 6. – С. 46-56. | uk |
dc.identifier.issn | 1997–9266 | |
dc.identifier.issn | 1997–9274 | |
dc.identifier.uri | https://ir.lib.vntu.edu.ua//handle/123456789/42866 | |
dc.description.abstract | Періодичні часові ряди зустрічаються в багатьох задачах — це і фінансові показники, і показники якості атмосферного повітря, і показники стану води тощо. Відповідно їхнє моделювання та аналіз закономірностей є актуальним і досить поширеним завданням для розуміння можливих тенденцій і змін для коректного та своєчасного реагування. Важливими параметрами періодичних часових рядів є параметри їхнього тренду, сезонних складових та аномалій. І якщо задача визначення тренду часового ряду має багато універсальних методів розв’язання, то ідентифікація одночасно параметрів
різних видів сезонності та аномалій різної природи у різні часові проміжки є складною задачею, яка не має універсального розв’язання. Більшість таких розв’язків є специфічними для конкретної предметної області або демонструють не чітку адекватність та точність апроксимації. Розроблено новий метод ідентифікації параметрів гармонік та аномалій періодичного часового ряду, який базується на адаптивній декомпозиції ряду. Зокрема, запропоновано здійснювати декомпозицію заданого часового ряду з періодом до половини від загальної кількості точок і будувати графік відношень амплітуд сезонної складової до амплітуд самого ряду — так званої «декомпозиційної кривої». А тоді, згладжувати цю криву і знаходити локальні максимуми, які пропонується вважати такими, що відповідають періоду можливих видів сезонності ряду. З урахуванням багаторічного досвіду використання моделі Facebook Prophet запропоновано низку співвідношень між періодом сезонності,
порядком ряду Фур’є для її апроксимації та ступенем регуляризації, який варто враховувати. Для
кожного виду сезонності у кожному періоді одним з відомих методів слід знаходити аномальні дані та
перевіряти їхню статистичну значущість. Статистично значущі аномалії збирати в єдину множину
з типовими параметрами. Запропоновано низку можливих варіантів структур таких моделей часового ряду. Наведено алгоритм методу та описано його основні складові.
Здійснено випробування запропонованого методу на Python на базі платформи Kaggle з використанням моделі Facebook Prophet на реальних даних спостережень за якістю атмосферного повітря,
отриманих з однієї зі станцій мережі громадського моніторингу EcoCity у межах міжнародної програми «Чисте повітря для України». Випробування показали, що порівняно з моделлю з параметрами і видами сезонності за замовчуванням, запропонований метод дозволив покращити точність апроксимації оптимальної моделі за метрикою R2 у 1,7 рази, а за метрикою MSE — у 2 рази. Це підтвердило ефективність запропонованого методу. | uk |
dc.description.abstract | Periodic time series have many applications — financial indicators, indicators of air quality, indicators of the state of water, etc. Accordingly, simulation of time series and pattern analysis are relevant and quite common tasks for understanding possible trends and changes for correct and timely actions. Important parameters of periodic time series are their trends, seasonal components, and anomalies. There exist numerous methods to determine the trend of a time series, but when it comes to the simultaneous identification of parameters of various types of seasonality and anomalies of different nature in different periods, this task is not trivial and there is no universal solution for this problem. Most of the solutions are specific to a specific subject area or demonstrate insufficient adequacy and accuracy of approximation. New method of identifying parameters of harmonics and anomalies of a periodic time series, based on the adaptive decomposition of the series, has been developed. It is proposed to decompose a given time series with a period up to half of the total number of time series records and to plot the ratio of the amplitudes of the seasonal component to the amplitudes of the series itself — the so-called “decomposition curve”. Then, smooth this curve and find local maxima, which are proposed to be considered as corresponding to the period of possible types of seasonality of the series. Considering many years of experience using the Facebook Prophet model, a set of relations between values of the seasonality period, the order of the Fourier series for its approximation, and the degree of regularization that should be taken into account are proposed. For each type of seasonality in each period, one of the known methods should be used to find anomalous data and check their statistical significance. Statistically significant anomalies are collected in a combined set with typical parameters. A few possible variants of the structures of such time series models are proposed. The algorithm of the method is developed, and its main components are described.
The offered method was tested in Python in the notebook of the Kaggle platform. This notebook uses the Facebook
Prophet model on real data of air quality observations obtained from one of the EcoCity public monitoring network stations within the international program “Clean Air for Ukraine”. Tests showed that compared to the model with default parameters and default parameters of seasonality, the optimal model of the proposed method improved the accuracy of the approximation for the R2 metric — by 1,7 times, and for the MSE metric — by 2 times. This confirms the effectiveness of the offered method. | en |
dc.language.iso | uk_UA | uk_UA |
dc.publisher | ВНТУ | uk |
dc.relation.ispartof | Вісник Вінницького політехнічного інституту. № 6 : 46-56. | uk |
dc.relation.uri | https://visnyk.vntu.edu.ua/index.php/visnyk/article/view/2954 | |
dc.subject | аналіз часових рядів | uk |
dc.subject | моделювання | uk |
dc.subject | машинне навчання | uk |
dc.subject | аномалії часових рядів | uk |
dc.subject | сезонність | uk |
dc.subject | гармоніки ряду Фур’є | uk |
dc.subject | якість атмосферного повітря | uk |
dc.subject | EcoCity | en |
dc.subject | time series analysis | en |
dc.subject | simulation | en |
dc.subject | machine learning | en |
dc.subject | time series anomalies | en |
dc.subject | seasonality | en |
dc.subject | Fourier series harmonics | en |
dc.subject | air quality | en |
dc.title | Метод ідентифікації параметрів гармонік та аномалій періодичного часового ряду на основі адаптивної декомпозиції | uk |
dc.title.alternative | Method of harmonics parameters identification and anomalies of a periodic time series based on adaptive decomposition | en |
dc.type | Article | |
dc.identifier.udc | 004.9:504.3.054 | |
dc.relation.references | Robert Shumway, and David Stoffer, Time Series Analysis and Its Applications With R Examples, 2011
https://doi.org/10.1007/978-1-4419-7865-3 . | en |
dc.relation.references | Б. І. Мокін, О. Б. Мокін, і В. Б. Мокін, Методологія та організація наукових досліджень, підруч., 3-е вид., змін.
та доп. Вінниця: ВНТУ, 2023, 230 с. ISBN 978-617-8163-01-3 (електр. ресурс). | uk |
dc.relation.references | Terence C. Mills, ARMA Models for Stationary Time Series, Chapter 3, Terence C. Mills, Ed., Applied Time Series
Analysis, Academic Press, 2019, pp. 31-56, ISBN 9780128131176. https://doi.org/10.1016/B978-0-12-813117-6.00003-X . | en |
dc.relation.references | Sean J Taylor, and Benjamin Letham, “Forecasting at scale,” Peer J. Preprints, 5, 2017.
https://doi.org/10.7287/peerj.preprints.3190v2 . | en |
dc.relation.references | В. Б. Мокін, О. В. Слободянюк, О. М. Давидюк, і Д. О. Шмундяк, «Інформаційна технологія пошуку можливих
джерел підвищеного забруднення річки з використанням моделі Prophet,» Вісник Вінницького політехнічного інституту,
№ 4, с. 15-24, 2020. https://doi.org/10.31649/1997-9266-2020-151-4-15-24 . | uk |
dc.relation.references | А. В. Лосенко, «Інформаційна технологія прогнозування часового ряду кількості хворих на коронавірус на основі моделі Facebook Prophet,» Вісник Вінницького політехнічного інституту, № 5, с. 50-59, 2023. https://doi.org/10.31649/1997-9266-
2023-170-5-50-59 . | uk |
dc.relation.references | В. Б. Мокін, А. В. Лосенко, і А. Р. Ящолт, «Інформаційна технологія аналізу та прогнозування кількості нових
випадків хвороби на коронавірус SARS-COV-2 в Україні на основі моделі Prophet», Вісник Вінницького політехнічного
інституту, № 5, с. 71-83, 2020. https://doi.org/10.31649/1997-9266-2020-152-5-71-83 . | uk |
dc.relation.references | В. Б. Мокін, А. В. Лосенко, і А. Р. Ящолт, «Інформаційна технологія аналізу та прогнозування багатохвильової
кількості нових випадків захворювань на коронавірус COVID-19 на основі моделі Prophet», Вісник Вінницького політехнічного інституту, № 6, с. 65-75, 2020. https://doi.org/10.31649/1997-9266-2020-153-6-65-75 . | uk |
dc.relation.references | Dmytro Shmundiak, and Vitalii Mokin, “Adaptive decomposition for harmonics and anomalies,” Kaggle Notebook. [Electronic resource]. Available: https://www.kaggle.com/code/dimashmundiak/adaptive-decomposition-for-harmonics-and-anomalies.
Accessed: 20.12.2023. | en |
dc.relation.references | Vitalii Mokin, and Arsen Losenko, “COVID-19 Ukraine daily cases – EDA,” Kaggle Notebook. [Electronic resource].
Available: https://www.kaggle.com/code/vbmokin/covid-19-ukraine-daily-cases-eda . Accessed: 12.10.2023. | en |
dc.relation.references | V. Aggarwal, V. Gupta, P. Singh, K. Sharma, and N. Sharma, “Detection of Spatial Outlier by Using Improved
Z-Score Test,” 2019 3rd International Conference on Trends in Electronics and Informatics (ICOEI), Tirunelveli, India,
2019, pp. 788-790. https://doi.org/10.1109/ICOEI.2019.8862582 . | en |
dc.relation.references | H. P. Vinutha, B. Poornima, and B. M. Sagar, “Detection of Outliers Using Interquartile Range Technique from Intrusion Dataset,” S. Satapathy, J. Tavares, V. Bhateja, J. Mohanty, Ed. Information and Decision Sciences. Advances in Intelligent
Systems and Computing, vol. 701, 2018, Springer, Singapore. https://doi.org/10.1007/978-981-10-7563-6_53 . | en |
dc.relation.references | Julien Lesouple, Cédric Baudoin, Marc Spigai, and Jean-Yves Tourneret, “Generalized isolation forest for anomaly detection,” Pattern Recognition Letters, vol. 149, pp. 109-119, 2021. ISSN 0167-8655. https://doi.org/10.1016/j.patrec.2021.05.022 . | en |
dc.relation.references | Salima Omar, Md Ngadi, Hamid Jebur, and Salima Benqdara, “Machine Learning Techniques for Anomaly Detection:
An Overview,” International Journal of Computer Applications, vol. 79, no. 2, 2013. https://doi.org/10.5120/13715-1478 . | en |
dc.relation.references | В. Б. Мокін, і А. В. Лосенко, «Інформаційна технологія короткострокового прогнозування кількості нових хворих на коронавірус на основі моделі Facebook Prophet. Інформаційно-комунікаційні технології для перемоги та відновлення,» у Колективна монографія за матеріалами ХХII Міжнародної науково-практичної конференції «Інформаційнокомунікаційні технології та сталий розвиток» (Київ, 14-15 листопада 2023 р.), С. О. Довгий. Ред. Київ, Україна: ТОВ
«Видавництво «Юстон», 2023, с. 27-30. | uk |
dc.relation.references | R. F. Woolson, Wilcoxon Signed-Rank Test. In Wiley Encyclopedia of Clinical Trials, R. B. D'Agostino, L. Sullivan and J. Massaro, Ed., 2008. https://doi.org/10.1002/9780471462422.eoct979 . | en |
dc.relation.references | P. E. McKnight, and J. Najab, “Mann-Whitney U Test,” In The Corsini Encyclopedia of Psychology , I. B. Weiner and
W. E. Craighead, Ed., 2010. https://doi.org/10.1002/9780470479216.corpsy0524 . | en |
dc.relation.references | Sklearn. API Reference. [Electronic resource]. Available: https://scikit-learn.org/stable/modules/classes.html . Accessed:
07.12.2023. | en |
dc.identifier.doi | https://doi.org/10.31649/1997-9266-2023-171-6-46-56 | |