| dc.contributor.author | Шмундяк, Д. О. | uk |
| dc.contributor.author | Мокін, В. Б. | uk |
| dc.contributor.author | Shmundiak, D. | en |
| dc.contributor.author | Mokin, V. B. | en |
| dc.date.accessioned | 2025-10-28T12:53:18Z | |
| dc.date.available | 2025-10-28T12:53:18Z | |
| dc.date.issued | 2024 | |
| dc.identifier.citation | Шмундяк Д. О., Мокін В. Б. Системний аналіз стану природних середовищ з урахуванням аномалій // Наукові праці ВНТУ. Електрон. текст. дані. 2024. Вип. 4. URI: https://praci.vntu.edu.ua/index.php/praci/article/view/763. | uk |
| dc.identifier.issn | 2307-5376 | |
| dc.identifier.uri | https://ir.lib.vntu.edu.ua//handle/123456789/49885 | |
| dc.description.abstract | The article presents a neural network approach for determining the temporal orientation in texts, which allows reconstructing the chronology of events even in the absence of explicit time markers. This approach determines the probabilistic
order of words in texts, taking into account their statistical and linguistic relationships. In contrast to traditional approaches
that rely on explicit temporal expressions or publication dates, the proposed approach allows to estimate the order of events
based on the identified relationships between pairs of words in documents, describing events.
To analyze the temporal orientation, neural networks are used to model the relationships between words by comparing
their occurrence in texts in pairs. Formulas have been developed to calculate temporal orientation indicators based on the
frequency of occurrence of words in dated texts. The obtained indicators are normalized, this provides a better interpretation
of the results.
Based on these indicators, a set of features was formed to train machine learning models according to various criteria.
To test the effectiveness, we created a Ukrainian-language corpus of 127,000 social media news and applied several models: Gradient Boosting Classifier, Random Forest Classifier, Decision Tree, and Logistic Regression. As an example, 48
features that characterize the news, were selected. The experiments revealed that the Gradient Boosting Classifier model
showed the best result with an accuracy of 89.76 % on the validation dataset, which exceeded the accuracy of other models
such as Random Forest (74.81%) and Decision Tree (68.97 %).
The proposed approach proved to be effective in modeling the chronological relationships between events, which is important for text automation tasks. The approach can be used to analyze news, chronologically organize historical events,
and work with text data in large arrays. | en |
| dc.description.abstract | Запропоновано нейромережевий підхід до визначення темпоральної спрямованості у текстах, що
дозволяє відтворювати хронологію подій, навіть за відсутності явних часових маркерів. Цей підхід
визначає ймовірнісний порядок появи слів у текстах з урахуванням їхніх статистичних та лінгвістичних зв’язків. На відміну від традиційних підходів, які покладаються на явні часові вирази або дати
публікацій, запропонований підхід дає змогу оцінювати порядок подій на основі виявлених взаємозв’язків між парами слів в документах, що описують події.
Для аналізу темпоральної спрямованості використовуються нейронні мережі, що дозволяють моделювати відносини між словами шляхом попарного порівняння їхньої появи в текстах. Запропоновано формули для обчислення показників темпоральної спрямованості, які базуються на частоті появи
слів у датованих текстах. Отримані показники нормалізовані, що забезпечує кращу інтерпретацію
результатів.
На основі цих показників сформовано набір ознак для тренування моделей машинного навчання за
різними критеріями. Для перевірки ефективності створено україномовний корпус із 127 000 новин
соціальних мереж та застосовано кілька моделей: Gradient Boosting Classifier, Random Forest
Classifier, Decision Tree та Logistic Regression. Як приклад, вибрано 48 ознак, які характеризують ці
новини. У ході експериментів виявлено, що модель Gradient Boosting Classifier показала найкращий
результат з точністю 89,76 % на валідаційному датасеті, що перевищило точність інших моделей,
таких як Random Forest (74,81 %) та Decision Tree (68,97 %).
Запропонований підхід підтвердив ефективність у моделюванні хронологічних зв’язків між подіями,
що є важливим для задач автоматизації текстів. Підхід можна використовувати для аналізу новин,
хронологічного впорядкування історичних подій і роботи з текстовими даними у великих масивах. | uk |
| dc.language.iso | uk_UA | uk_UA |
| dc.publisher | ВНТУ | uk |
| dc.relation.ispartof | Наукові праці ВНТУ. Вип. 4. | uk |
| dc.relation.uri | https://praci.vntu.edu.ua/index.php/praci/article/view/763/734 | |
| dc.subject | системний аналіз | uk |
| dc.subject | штучний інтелект | uk |
| dc.subject | інформаційні технології | uk |
| dc.subject | природне середовище | uk |
| dc.subject | прогнозування часових рядів | uk |
| dc.subject | якість атмосферного повітря | uk |
| dc.subject | стан вод | uk |
| dc.subject | аномалії | uk |
| dc.subject | сезонність | uk |
| dc.subject | машинне навчання | uk |
| dc.subject | інтелектуальний аналіз даних | uk |
| dc.subject | моделювання | uk |
| dc.subject | метод аналізу ієрархій | uk |
| dc.subject | system analysis | en |
| dc.subject | artificial intelligence | en |
| dc.subject | information technologies | en |
| dc.subject | natural environment | en |
| dc.subject | time series forecasting | en |
| dc.subject | air quality | uk |
| dc.subject | water conditions | en |
| dc.subject | anomalies | en |
| dc.subject | seasonality | en |
| dc.subject | machine learning | en |
| dc.subject | intelligent data analysis | en |
| dc.subject | modeling | en |
| dc.subject | analytic hierarchy process | en |
| dc.title | Системний аналіз стану природних середовищ з урахуванням аномалій | uk |
| dc.type | Article, professional native edition | |
| dc.type | Article | |
| dc.identifier.udc | 004.9+504.3.054 | |
| dc.relation.references | Environmental indicators: Typology and overview. EdithSmeetsandRobWeterings. 1999. URL:
https://www.eea.europa.eu/publications/TEC25 | en |
| dc.relation.references | Згуровський М. З., Панкратова Н. Д.Основи системного аналізу. К.: Видавнича група BHV, 2007. 546 с. | uk |
| dc.relation.references | Мокін Б. І., Мокін О. Б., Мокін В. Б. Методологія та організація наукових досліджень : підручник –
вид. 3-е, змін. та доп. Вінниця: ВНТУ, 2023. 230 с | uk |
| dc.relation.references | Мокін В. Б., Дратований М. В. Наука про дані: машинне навчання та інтелектуальний аналіз даних :
електронний навчальний посібник комбінованого (локального та мережевого) використання. Вінниця : ВНТУ,
2024. 258 с. URL: https://pdf.lib.vntu.edu.ua/books/2024/Mokin_2024_263.pdf | uk |
| dc.relation.references | Аналіз можливостей Python-бібліотек щодо виявлення аномальних даних у задачі прогнозування стану
атмосферного повітря / Д. О. Шмундяк та ін. Матеріали LII науково-технічної конференції підрозділів
Вінницького національного технічного університету (НТКП ВНТУ–2023) : збірник доповідей. – Вінниця :
ВНТУ, 2023. C. 313 – 316. | uk |
| dc.relation.references | Інформаційна технологія пошуку можливих джерел підвищеного забруднення річки з використанням
моделі Prophet / В. Б. Мокін та ін, Вісник ВПІ. Верес. 2020. Вип. 4. С. 15 – 24. https://doi.org/10.31649/1997-9266-
2020-151-4-15-24. | uk |
| dc.relation.references | Шмундяк Д. О. Метод пошуку можливих джерел забруднення атмосферного повітря на основі аналізу
аномалій. Матеріали ХХІІІ Міжнародної науково-практичної конференції Математичне моделювання та
інформаційно-комунікаційні технології для перемоги та відновлення, Вінниця, 16-17 жовтня 2024 р | uk |
| dc.relation.references | Технологія проєктування мережі спостережень якості атмосферного повітря регіону на основі методу
аналізу ієрархій / В. Б. Мокін та ін. Наукові праці ВНТУ. 2022. № 4. https://doi.org/10.31649/2307-5376-2021-4-
21-33. | uk |
| dc.relation.references | Шмундяк Д. О. Дослідження впливу параметрів моделі Prophet на точність прогнозування якості
атмосферного повітря. Матеріали LII науково-технічної конференції підрозділів Вінницького національного
технічного університету (НТКП ВНТУ–2023) : збірник доповідей. – Вінниця : ВНТУ, 2023. C. 269 – 272. | uk |
| dc.relation.references | Огляд підходів до визначення порядку Фур'є у моделі Facebook Prophet для моделювання сезонної
складової часового ряду / Д. О. Шмундяк та ін. Матеріали LII науково-технічної конференції підрозділів
Вінницького національного технічного університету (НТКП ВНТУ–2023) : збірник доповідей. – Вінниця :
ВНТУ, 2023. C. 239 – 241. | uk |
| dc.relation.references | Шмундяк Д. О., Мокін В. Б. Метод ідентифікації параметрів гармонік та аномалій періодичного часового
ряду на основі адаптивної декомпозиції. Вісник ВПІ. Груд. 2023. Вип. 6. С. 46 – 56.
DOI: https://doi.org/10.31649/1997-9266-2023-171-6-46-56. | uk |
| dc.relation.references | Шмундяк Д. О., Копняк В. Є. Метод ідентифікації локальних аномалій значень показників стану
довкілля з використанням декомпозиції на півхвилі. Вісник ВПІ. Лют. 2024. Вип. 1. С. 88 – 100.
https://doi.org/10.31649/1997-9266-2024-172-1-88-100. | uk |
| dc.relation.references | Bayesian analysis suggests independent development of sensitization to different fungal allergens /
Rodinkova V. et al. World Allergy Organization Journal. 2024. Volume 17, Issue 5. P. 100908. ISSN 1939-4551.
https://doi.org/10.1016/j.waojou.2024.100908. | en |
| dc.relation.references | Shmundiak D. Bayes for air monitoring data Kaggle Notebook. 2024. URL:
https://www.kaggle.com/code/dimashmundiak/bayes-for-air-monitoring-data. | en |
| dc.relation.references | Про затвердження Програми державного моніторингу в галузі охорони атмосферного повітря на 2023–
2027 роки для зони «Вінницька». 2021. URL: https://mepr.gov.ua/wp-content/uploads/2023/01/Natsdopovid-2021-
n.pdf. | uk |
| dc.relation.references | Mokin V., Shmundiak D., Kopniak V. Air Quality Monitoring from EcoCity” Kaggle Dataset. 2021. URL:
https://www.kaggle.com/datasets/vbmokin/air-quality-monitoring-from-ecocity | en |
| dc.relation.references | Mokin V., Shmundiak D. WQ SB river : Analysis & Forecasting” Kaggle Notebook. 2022. URL:
https://www.kaggle.com/code/vbmokin/wq-sb-river-analysis-forecasting | en |
| dc.relation.references | Мокін В. Б., Шмундяк Д. О., Копняк В. Є. Порівняльний розвідувальний аналіз даних про стан
атмосферного повітря за даними мережі EcoCityз використанням бібліотеки Sweetviz. Матеріали LIII науковотехнічної конференції підрозділів Вінницького національного технічного університету (НТКП ВНТУ–2024) :
збірник доповідей. Вінниця : ВНТУ, 2024. C. 948 – 951. | uk |
| dc.relation.references | Шмундяк Д. О. Порівняльний аналіз моделей прогнозування показника стану атмосферного повітря.
Матеріали ХVІI Міжнародної конференція «Контроль і управління в складних системах» (КУСС-2024),
Вінниця, 16-17 жовтня 2024. URL: https://conferences.vntu.edu.ua/index.php/mccs/mccs2024/paper/view/22120. | uk |
| dc.relation.references | Shmundiak D. Comparing time series prediction models” Kaggle Notebook. 2024. URL:
https://www.kaggle.com/code/dimashmundiak/comparing-time-series-prediction-models. | en |
| dc.identifier.doi | https://doi.org/10.31649/2307-5376-2024-4-63-73 | |