Показати скорочену інформацію

dc.contributor.authorШмундяк, Д. О.uk
dc.contributor.authorМокін, В. Б.uk
dc.contributor.authorShmundiak, D.en
dc.contributor.authorMokin, V. B.en
dc.date.accessioned2025-10-28T12:53:18Z
dc.date.available2025-10-28T12:53:18Z
dc.date.issued2024
dc.identifier.citationШмундяк Д. О., Мокін В. Б. Системний аналіз стану природних середовищ з урахуванням аномалій // Наукові праці ВНТУ. Електрон. текст. дані. 2024. Вип. 4. URI: https://praci.vntu.edu.ua/index.php/praci/article/view/763.uk
dc.identifier.issn2307-5376
dc.identifier.urihttps://ir.lib.vntu.edu.ua//handle/123456789/49885
dc.description.abstractThe article presents a neural network approach for determining the temporal orientation in texts, which allows reconstructing the chronology of events even in the absence of explicit time markers. This approach determines the probabilistic order of words in texts, taking into account their statistical and linguistic relationships. In contrast to traditional approaches that rely on explicit temporal expressions or publication dates, the proposed approach allows to estimate the order of events based on the identified relationships between pairs of words in documents, describing events. To analyze the temporal orientation, neural networks are used to model the relationships between words by comparing their occurrence in texts in pairs. Formulas have been developed to calculate temporal orientation indicators based on the frequency of occurrence of words in dated texts. The obtained indicators are normalized, this provides a better interpretation of the results. Based on these indicators, a set of features was formed to train machine learning models according to various criteria. To test the effectiveness, we created a Ukrainian-language corpus of 127,000 social media news and applied several models: Gradient Boosting Classifier, Random Forest Classifier, Decision Tree, and Logistic Regression. As an example, 48 features that characterize the news, were selected. The experiments revealed that the Gradient Boosting Classifier model showed the best result with an accuracy of 89.76 % on the validation dataset, which exceeded the accuracy of other models such as Random Forest (74.81%) and Decision Tree (68.97 %). The proposed approach proved to be effective in modeling the chronological relationships between events, which is important for text automation tasks. The approach can be used to analyze news, chronologically organize historical events, and work with text data in large arrays.en
dc.description.abstractЗапропоновано нейромережевий підхід до визначення темпоральної спрямованості у текстах, що дозволяє відтворювати хронологію подій, навіть за відсутності явних часових маркерів. Цей підхід визначає ймовірнісний порядок появи слів у текстах з урахуванням їхніх статистичних та лінгвістичних зв’язків. На відміну від традиційних підходів, які покладаються на явні часові вирази або дати публікацій, запропонований підхід дає змогу оцінювати порядок подій на основі виявлених взаємозв’язків між парами слів в документах, що описують події. Для аналізу темпоральної спрямованості використовуються нейронні мережі, що дозволяють моделювати відносини між словами шляхом попарного порівняння їхньої появи в текстах. Запропоновано формули для обчислення показників темпоральної спрямованості, які базуються на частоті появи слів у датованих текстах. Отримані показники нормалізовані, що забезпечує кращу інтерпретацію результатів. На основі цих показників сформовано набір ознак для тренування моделей машинного навчання за різними критеріями. Для перевірки ефективності створено україномовний корпус із 127 000 новин соціальних мереж та застосовано кілька моделей: Gradient Boosting Classifier, Random Forest Classifier, Decision Tree та Logistic Regression. Як приклад, вибрано 48 ознак, які характеризують ці новини. У ході експериментів виявлено, що модель Gradient Boosting Classifier показала найкращий результат з точністю 89,76 % на валідаційному датасеті, що перевищило точність інших моделей, таких як Random Forest (74,81 %) та Decision Tree (68,97 %). Запропонований підхід підтвердив ефективність у моделюванні хронологічних зв’язків між подіями, що є важливим для задач автоматизації текстів. Підхід можна використовувати для аналізу новин, хронологічного впорядкування історичних подій і роботи з текстовими даними у великих масивах.uk
dc.language.isouk_UAuk_UA
dc.publisherВНТУuk
dc.relation.ispartofНаукові праці ВНТУ. Вип. 4.uk
dc.relation.urihttps://praci.vntu.edu.ua/index.php/praci/article/view/763/734
dc.subjectсистемний аналізuk
dc.subjectштучний інтелектuk
dc.subjectінформаційні технологіїuk
dc.subjectприродне середовищеuk
dc.subjectпрогнозування часових рядівuk
dc.subjectякість атмосферного повітряuk
dc.subjectстан водuk
dc.subjectаномаліїuk
dc.subjectсезонністьuk
dc.subjectмашинне навчанняuk
dc.subjectінтелектуальний аналіз данихuk
dc.subjectмоделюванняuk
dc.subjectметод аналізу ієрархійuk
dc.subjectsystem analysisen
dc.subjectartificial intelligenceen
dc.subjectinformation technologiesen
dc.subjectnatural environmenten
dc.subjecttime series forecastingen
dc.subjectair qualityuk
dc.subjectwater conditionsen
dc.subjectanomaliesen
dc.subjectseasonalityen
dc.subjectmachine learningen
dc.subjectintelligent data analysisen
dc.subjectmodelingen
dc.subjectanalytic hierarchy processen
dc.titleСистемний аналіз стану природних середовищ з урахуванням аномалійuk
dc.typeArticle, professional native edition
dc.typeArticle
dc.identifier.udc004.9+504.3.054
dc.relation.referencesEnvironmental indicators: Typology and overview. EdithSmeetsandRobWeterings. 1999. URL: https://www.eea.europa.eu/publications/TEC25en
dc.relation.referencesЗгуровський М. З., Панкратова Н. Д.Основи системного аналізу. К.: Видавнича група BHV, 2007. 546 с.uk
dc.relation.referencesМокін Б. І., Мокін О. Б., Мокін В. Б. Методологія та організація наукових досліджень : підручник – вид. 3-е, змін. та доп. Вінниця: ВНТУ, 2023. 230 сuk
dc.relation.referencesМокін В. Б., Дратований М. В. Наука про дані: машинне навчання та інтелектуальний аналіз даних : електронний навчальний посібник комбінованого (локального та мережевого) використання. Вінниця : ВНТУ, 2024. 258 с. URL: https://pdf.lib.vntu.edu.ua/books/2024/Mokin_2024_263.pdfuk
dc.relation.referencesАналіз можливостей Python-бібліотек щодо виявлення аномальних даних у задачі прогнозування стану атмосферного повітря / Д. О. Шмундяк та ін. Матеріали LII науково-технічної конференції підрозділів Вінницького національного технічного університету (НТКП ВНТУ–2023) : збірник доповідей. – Вінниця : ВНТУ, 2023. C. 313 – 316.uk
dc.relation.referencesІнформаційна технологія пошуку можливих джерел підвищеного забруднення річки з використанням моделі Prophet / В. Б. Мокін та ін, Вісник ВПІ. Верес. 2020. Вип. 4. С. 15 – 24. https://doi.org/10.31649/1997-9266- 2020-151-4-15-24.uk
dc.relation.referencesШмундяк Д. О. Метод пошуку можливих джерел забруднення атмосферного повітря на основі аналізу аномалій. Матеріали ХХІІІ Міжнародної науково-практичної конференції Математичне моделювання та інформаційно-комунікаційні технології для перемоги та відновлення, Вінниця, 16-17 жовтня 2024 рuk
dc.relation.referencesТехнологія проєктування мережі спостережень якості атмосферного повітря регіону на основі методу аналізу ієрархій / В. Б. Мокін та ін. Наукові праці ВНТУ. 2022. № 4. https://doi.org/10.31649/2307-5376-2021-4- 21-33.uk
dc.relation.referencesШмундяк Д. О. Дослідження впливу параметрів моделі Prophet на точність прогнозування якості атмосферного повітря. Матеріали LII науково-технічної конференції підрозділів Вінницького національного технічного університету (НТКП ВНТУ–2023) : збірник доповідей. – Вінниця : ВНТУ, 2023. C. 269 – 272.uk
dc.relation.referencesОгляд підходів до визначення порядку Фур'є у моделі Facebook Prophet для моделювання сезонної складової часового ряду / Д. О. Шмундяк та ін. Матеріали LII науково-технічної конференції підрозділів Вінницького національного технічного університету (НТКП ВНТУ–2023) : збірник доповідей. – Вінниця : ВНТУ, 2023. C. 239 – 241.uk
dc.relation.referencesШмундяк Д. О., Мокін В. Б. Метод ідентифікації параметрів гармонік та аномалій періодичного часового ряду на основі адаптивної декомпозиції. Вісник ВПІ. Груд. 2023. Вип. 6. С. 46 – 56. DOI: https://doi.org/10.31649/1997-9266-2023-171-6-46-56.uk
dc.relation.referencesШмундяк Д. О., Копняк В. Є. Метод ідентифікації локальних аномалій значень показників стану довкілля з використанням декомпозиції на півхвилі. Вісник ВПІ. Лют. 2024. Вип. 1. С. 88 – 100. https://doi.org/10.31649/1997-9266-2024-172-1-88-100.uk
dc.relation.referencesBayesian analysis suggests independent development of sensitization to different fungal allergens / Rodinkova V. et al. World Allergy Organization Journal. 2024. Volume 17, Issue 5. P. 100908. ISSN 1939-4551. https://doi.org/10.1016/j.waojou.2024.100908.en
dc.relation.referencesShmundiak D. Bayes for air monitoring data Kaggle Notebook. 2024. URL: https://www.kaggle.com/code/dimashmundiak/bayes-for-air-monitoring-data.en
dc.relation.referencesПро затвердження Програми державного моніторингу в галузі охорони атмосферного повітря на 2023– 2027 роки для зони «Вінницька». 2021. URL: https://mepr.gov.ua/wp-content/uploads/2023/01/Natsdopovid-2021- n.pdf.uk
dc.relation.referencesMokin V., Shmundiak D., Kopniak V. Air Quality Monitoring from EcoCity” Kaggle Dataset. 2021. URL: https://www.kaggle.com/datasets/vbmokin/air-quality-monitoring-from-ecocityen
dc.relation.referencesMokin V., Shmundiak D. WQ SB river : Analysis & Forecasting” Kaggle Notebook. 2022. URL: https://www.kaggle.com/code/vbmokin/wq-sb-river-analysis-forecastingen
dc.relation.referencesМокін В. Б., Шмундяк Д. О., Копняк В. Є. Порівняльний розвідувальний аналіз даних про стан атмосферного повітря за даними мережі EcoCityз використанням бібліотеки Sweetviz. Матеріали LIII науковотехнічної конференції підрозділів Вінницького національного технічного університету (НТКП ВНТУ–2024) : збірник доповідей. Вінниця : ВНТУ, 2024. C. 948 – 951.uk
dc.relation.referencesШмундяк Д. О. Порівняльний аналіз моделей прогнозування показника стану атмосферного повітря. Матеріали ХVІI Міжнародної конференція «Контроль і управління в складних системах» (КУСС-2024), Вінниця, 16-17 жовтня 2024. URL: https://conferences.vntu.edu.ua/index.php/mccs/mccs2024/paper/view/22120.uk
dc.relation.referencesShmundiak D. Comparing time series prediction models” Kaggle Notebook. 2024. URL: https://www.kaggle.com/code/dimashmundiak/comparing-time-series-prediction-models.en
dc.identifier.doihttps://doi.org/10.31649/2307-5376-2024-4-63-73


Файли в цьому документі

Thumbnail

Даний документ включений в наступну(і) колекцію(ї)

Показати скорочену інформацію