dc.contributor.author | Мокін, В. Б. | uk |
dc.contributor.author | Лучко, А. М. | uk |
dc.contributor.author | Давидюк, О. М. | uk |
dc.contributor.author | Вуж, Т. Є. | uk |
dc.contributor.author | Mokin, V. B. | en |
dc.contributor.author | Luchko, A. M. | en |
dc.contributor.author | Davydiuk, O. M. | en |
dc.contributor.author | Vuzh, T. Ye. | en |
dc.contributor.author | Мокин, В. Б. | ru |
dc.contributor.author | Лучко, А. М. | ru |
dc.contributor.author | Давидюк, О. Н. | ru |
dc.contributor.author | Вуж, Т. Е. | ru |
dc.date.accessioned | 2021-04-12T08:34:46Z | |
dc.date.available | 2021-04-12T08:34:46Z | |
dc.date.issued | 2021 | |
dc.identifier.citation | Технологія побудови експертної інформаційної веб-системи виявлення та верифікації пріоритетних екологічних проблем у масивах вод басейну річки / В. Б. Мокін, А. М. Лучко, О. М. Давидюк, Т. Є. Вуж // Вісник Вінницького політехнічного інституту. – 2021. – № 1. – С. 77-87. | uk |
dc.identifier.issn | 1997-9266 | |
dc.identifier.issn | 1997–9274 | |
dc.identifier.uri | http://ir.lib.vntu.edu.ua//handle/123456789/31808 | |
dc.description.abstract | Розглянуто питання збирання, верифікації та узагальнення великої кількості експертних оцінок про наявний стан вод, наявні екологічні проблеми та впливові фактори, які збільшують ризик недосягнення екологічних цілей кожним масивом вод під час розроблення програм заходів планів управління річкового басейну (ПУРБ), спрямованих на досягнення чи стабілізацію доброго екологічного стану води у масивах вод цього басейну. Задача ускладнюється великою кількістю таких масивів вод, оскільки зібрати достовірну інформацію про об’єкти, розташовані у кожному з них, вкрай важко. Розв’язати це питання дозволить створення веб-системи з картою масивів вод і залученням великої кількості експертів із місцевих жителів, небайдужих до проблем свого довкілля. Проте, тоді виникає проблема перевірки достовірності оцінок цих експертів, враховуючи їх різну кваліфікацію, досвід роботи, різне бачення цілей ПУРБ, та проблема як їх зіставляти, щоб визначити найвразливіші регіони за різними критеріями. Для цього запропоновано вимагати від експертів не просто експертні оцінки на основі єдиних довідників варіантів можливих відповідей, а й посилання на текстові веб-ресурси, які підтверджують їх оцінки. А потім аналізувати наскільки ці джерела дійсно підтверджують кожну оцінку щодо відповідного типу проблеми для певного регіону. Авторами розглянуті різноманітні підходи для зіставлення експертних оцінок як на основі нечітких множин, так і за допомогою технологій машинного навчання та опрацювання природної мови (англ. — Natural Language Processing (NLP)). Розглянуто аналоги розроблювальної авторами системи.
Розроблено метод виявлення та верифікації пріоритетних екологічних проблем у масивах вод басейну річки за нечіткими експертними оцінками, з урахуванням ймовірностей того, що процитовані експертом текстові матеріали дійсно відповідають зазначеній проблемі. Ці ймовірності визначаються з використанням моделей NLP-технологій. Охарактеризовано етапи функціонування експертної інформаційної веб-системи для реалізації запропонованої технології, яка дозволить одночасно зібрати максимально достовірну і детальну інформацію про об’єкти масивів вод та прискорити її опрацювання і ранжування.
Наведено приклад реалізації інформаційної веб-системи виявлення пріоритетних екологічних проблем у масивах вод басейну річки Південний Буг. Наведено приклади обчислення достовірності експертних оцінок із застосуванням авторської програми на Python на основі NLP-моделі BERT і логістичної регресії до реальної текстової інформації. | uk |
dc.description.abstract | The article considers the collection, verification and generalization of a large number of expert assessments of the cur-rent state of waters, existing environmental problems and influential factors that increase the risk of failure to achieve envi-ronmental goals of each volume of water during the development of river basin management plans (RBMPs) or stabilization of good ecological status of water in the water bodies of this basin. The task is complicated by the large number of such volumes of water, as it is extremely difficult to gather reliable information about the objects located in each of them. Creation of a web system with a map of water volumes and the involvement of a large number of experts from among locals who are not indifferent to the problems of their environment will help to solve this problem. However, then there is the problem of verifying the assessments of these experts, taking into account their different qualifications, experience, different views of the objectives of the RBMP, and the problem of how to compare them to identify the most vulnerable regions by different criteria. It is proposed that experts will be required not only expert assessments on the basis of single directories of possible answers, but also - links to text web resources that confirm their assessments to solve this problem. And then it will be ana-lyzed if these sources really confirm each assessment of the appropriate type of problem for a given region. The authors consider various approaches for comparing expert assessments both based on the basis of fuzzy sets and with the help of machine learning and natural language processing (NLP) technologies. Analogues of the system developed by the authors are considered.
A method has been developed to identify and verify priority of environmental problems in water bodies of the river basin based on fuzzy expert estimates, taking into account the probabilities that the text materials cited by the expert do corre-spond to this problem. These probabilities are determined to use models of NLP technologies. The stages of functioning of the expert information web system for the implementation of the proposed technology are described, which will simultane-ously collect the most reliable and detailed information about the objects of water bodies and accelerate its processing and ranking.
An example of the implementation of an information web system for identifying priority environmental problems in the water bodies of the Southern Bug River basin is given. Examples of calculating the reliability of expert estimates using the author’s program in Python based on NLP-model BERT and logistic regression which were applied to real text information are given. | en |
dc.description.abstract | Рассмотрены вопросы сбора, верификации и обобщения большого количества экспертных оценок о реальном состоянии вод, имеющихся экологических проблемах и влияющих факторах, увеличивающих риск недостижения экологических целей каждым массивом вод при разработке программ мероприятий планов управления речного бассейна (ПУРБ), направленных на достижение или стабилизацию хорошего экологического состояния воды в массивах вод этого бассейна. Задача усложняется большим количеством таких массивов вод, поскольку со-брать достоверную информацию об объектах, расположенных в каждом из них, крайне трудно. Решить эту проблему позволит создание веб-системы с картой массивов вод и привлечением большого количества экспер-тов из числа местных жителей, неравнодушных к проблемам своей окружающей среды. Однако, тогда возника-ет проблема проверки достоверности оценок этих экспертов, учитывая их разную квалификацию, опыт рабо-ты, разное видение целей ПУРБ, и проблема как их сопоставлять, чтобы определить наиболее уязвимые регио-ны по различным критериям. Для этого предложено требовать от экспертов не просто экспертные оценки на основе единых справочников вариантов возможных ответов, но и ссылки на текстовые веб-ресурсы, подтвер-ждающие их оценки. А потом анализировать насколько эти источники действительно подтверждают каждую оценку относительно соответствующего типа проблемы для этого региона. Авторами рассмотрены различ-ные подходы для сопоставления экспертных оценок как на основе нечетких множеств, так и с помощью техно-логий машинного обучения и обработки естественного языка (англ. — Natural Language Processing (NLP)). Рас-смотрены аналоги разрабатываемой авторами системы.
Разработан метод выявления и верификации приоритетных экологических проблем в массивах вод бассейна реки с нечеткими экспертными оценками, с учетом вероятностей того, что процитированные экспертом тек-стовые материалы действительно соответствуют указанной проблеме. Эти вероятности определяются с использованием моделей NLP-технологий. Охарактеризованы этапы функционирования экспертной информацион-ной веб-системы для реализации предложенной технологии, которая позволит одновременно собрать максималь-но достоверную и подробную информацию об объектах массивов вод и ускорить ее обработку и ранжирование.
Приведен пример реализации информационной веб-системы выявления приоритетных экологических про-блем в массивах вод бассейна реки Южный Буг. Приведены примеры вычисления достоверности экспертных оценок с применением авторской программы на Python на основе NLP-модели BERT и логистической регрессии к реальной текстовой информации. | ru |
dc.language.iso | uk_UA | uk_UA |
dc.publisher | ВНТУ | uk |
dc.relation.ispartof | Вісник Вінницького політехнічного інституту. № 1 : 77-87. | uk |
dc.relation.uri | https://visnyk.vntu.edu.ua/index.php/visnyk/article/view/2585 | |
dc.subject | інформаційна веб-система | uk |
dc.subject | технології захисту водних ресурсів | uk |
dc.subject | експертні оцінки | uk |
dc.subject | нечіткі множини | uk |
dc.subject | екологічні проблеми | uk |
dc.subject | масив вод | uk |
dc.subject | ПУРБ | uk |
dc.subject | машинне навчання | uk |
dc.subject | класифікація текстових даних | uk |
dc.subject | технології опрацювання природної мови | uk |
dc.subject | NLP | en |
dc.subject | BERT | en |
dc.subject | information web system | en |
dc.subject | water protection technologies | en |
dc.subject | expert assessments | en |
dc.subject | fuzzy sets | en |
dc.subject | environmental problems | en |
dc.subject | water body | en |
dc.subject | RBMP | en |
dc.subject | machine learning | en |
dc.subject | text data classification | en |
dc.subject | natural language processing | en |
dc.subject | информационная веб-система | ru |
dc.subject | технологии защиты водных ресурсов | ru |
dc.subject | экспертные оценки | ru |
dc.subject | нечеткие множества | ru |
dc.subject | экологические проблемы | ru |
dc.subject | массив вод | ru |
dc.subject | ПУРБ | ru |
dc.subject | машинное обучение | ru |
dc.subject | классификация текстовых данных | ru |
dc.subject | технологии обработки естественного языка | ru |
dc.title | Технологія побудови експертної інформаційної веб-системи виявлення та верифікації пріоритетних екологічних проблем у масивах вод басейну річки | uk |
dc.title.alternative | Technology of Construction of Expert InformationWeb System of Identifica-tion and Verification of Priority Ecological Problems in Water Bodies of the River Basin | en |
dc.title.alternative | Технология построения экспертной информационной веб-системы выявления и верификации приоритетных экологических проблем в массиве вод бассейна реки | ru |
dc.type | Article | |
dc.identifier.udc | 004.9+556 | |
dc.relation.references | Кабінет Міністрів України, Постанова № 336 від 18.05.2017 року «Про затвердження Порядку розроблення плану управління річковим басейном». [Електронний ресурс]. Режим доступу: https://www.davr.gov.ua/postanova-kabinetu-ministriv-ukraini-vid-18-travnya-2017-roku--336-pro-zatverdzhennya-poryadku-rozroblennya-planu-upravlinnya-richkovim-basejnom . | uk |
dc.relation.references | The EU Water Framework Directive – integrated river basin management for Europe Directive 2000/60/ЕС establishing a framework for the Community action of water policy (Water Framework Directive). | en |
dc.relation.references | Ю. І. Мітюшкін, Б. І. Мокін, і О. П. Ротштейн, Soft Computing: ідентифікація закономірностей нечіткими базами знань, моногр. Вінниця, Україна: УНІВЕРСУМ-Вінниця, 2002, 145 с. [Електронний ресурс]. Режим доступу: http://mokin.com.ua/files/articles/60/88/SoftComputing.pdf . | uk |
dc.relation.references | В. М. Дубовой, Р. Н. Квєтний, О. І. Михальов, і А. В. Усов, Моделювання та оптимізація систем, підруч. Вінни-ця, Україна: ПП «ТД«Едельвейс», 2017, 804 с. | uk |
dc.relation.references | Haining Ding, Xiaojian Hu, and Xiaoan Tang «Multiple-attribute group decision making for interval-valued intuitionistic fuzzy sets based on expert reliability and the evidential reasoning rule,» Neural Computing and Applications, vol. 32, pp. 5213-5234, 2020. [Electronic resource]. Available: https://link.springer.com/article/10.1007%2Fs00521-019-04016-z . | en |
dc.relation.references | Jean-Valère Cossu, Emmanuel Ferreira, Killian Janod, Julien Gaillard, and Marc El-Bèze «NLP-Based Classifiers to Generalize Expert Assessments in E-Reputation,» in International Conference of the Cross-Language Evaluation Forum for European Languages, vol. 9283, pp. 340-351, 2015. [Electronic resource]. Available: https://link.springer.com/chapter/10.1007/978-3-319-24027-5_37 . | en |
dc.relation.references | Matthew Matero, et al., «Suicide Risk Assessment with Multi-level Dual-Context Language and BERT,» Proceedings of the Sixth Workshop on Computational Linguistics and Clinical Psychology, pp. 39-44, 2019. [Electronic resource]. Available: https://www.aclweb.org/anthology/W19-3005.pdf . | en |
dc.relation.references | Er. Samadhan, U. Birajdar, and V. A. Losarwar, «Mining opinion targets and opinion words from reviews using natural lan-guage processing (NLP) techniques,» Journal of Critical Reviews, vol. 8, pp. 1029-1036, 2020. [Electronic resource]. Available: http://www.jcreview.com/?mno=95186 . | en |
dc.relation.references | В. Б. Мокін, «Ідентифікація параметрів малих річок на основі теорії нечітких множин по експертних оцінках та по їх геоінформаційній моделі,» Вісник ЖДТУ, c. 133-142, 2004. | uk |
dc.relation.references | В. Б. Мокін, «Новий підхід до ідентифікації параметрів малих річок за нечіткими експертними оцінками,» Віс-ник Вінницького політехнічного інституту, № 4, c. 34-41, 2005. | uk |
dc.relation.references | Scikit-learn 0.24.1. Machine Learning in Python. User Guide. [Electronic resource]. Available:
https://scikit-learn.org/stable/user_guide.html . | en |
dc.relation.references | V. Mokin, D. Pasichniuk, O. Radetskyi, and M. Horash, Kaggle Dataset NLP: Reports & News Classification. ENG & UKR Automatic Environmental Reports & News Classification, 2020. [Electronic resource]. Available:
https://www.kaggle.com/vbmokin/nlp-reports-news-classification . | en |
dc.relation.references | Афанасьєв С., та ін., План управління річковим басейном Південного Бугу: аналіз стану та першочергові заходи. Київ, Україна: ТОВ «НВП «Інтерсервіс», 2014, 188 с. | uk |
dc.relation.references | V. Mokin, A. Luchko, and O. Davidyuk, Kaggle. NLP for EN: BERT Predict_proba in Water Report, [Electronic re-source]. Available: https://www.kaggle.com/vbmokin/nlp-for-en-bert-predict-proba-in-water-report?scriptVersionId=53779986 . | en |
dc.identifier.doi | https://doi.org/10.31649/1997-9266-2021-154-1-77-87 | |