Технологія побудови експертної інформаційної веб-системи виявлення та верифікації пріоритетних екологічних проблем у масивах вод басейну річки
Author
Мокін, В. Б.
Лучко, А. М.
Давидюк, О. М.
Вуж, Т. Є.
Mokin, V. B.
Luchko, A. M.
Davydiuk, O. M.
Vuzh, T. Ye.
Мокин, В. Б.
Лучко, А. М.
Давидюк, О. Н.
Вуж, Т. Е.
Date
2021Metadata
Show full item recordCollections
Abstract
Розглянуто питання збирання, верифікації та узагальнення великої кількості експертних оцінок про наявний стан вод, наявні екологічні проблеми та впливові фактори, які збільшують ризик недосягнення екологічних цілей кожним масивом вод під час розроблення програм заходів планів управління річкового басейну (ПУРБ), спрямованих на досягнення чи стабілізацію доброго екологічного стану води у масивах вод цього басейну. Задача ускладнюється великою кількістю таких масивів вод, оскільки зібрати достовірну інформацію про об’єкти, розташовані у кожному з них, вкрай важко. Розв’язати це питання дозволить створення веб-системи з картою масивів вод і залученням великої кількості експертів із місцевих жителів, небайдужих до проблем свого довкілля. Проте, тоді виникає проблема перевірки достовірності оцінок цих експертів, враховуючи їх різну кваліфікацію, досвід роботи, різне бачення цілей ПУРБ, та проблема як їх зіставляти, щоб визначити найвразливіші регіони за різними критеріями. Для цього запропоновано вимагати від експертів не просто експертні оцінки на основі єдиних довідників варіантів можливих відповідей, а й посилання на текстові веб-ресурси, які підтверджують їх оцінки. А потім аналізувати наскільки ці джерела дійсно підтверджують кожну оцінку щодо відповідного типу проблеми для певного регіону. Авторами розглянуті різноманітні підходи для зіставлення експертних оцінок як на основі нечітких множин, так і за допомогою технологій машинного навчання та опрацювання природної мови (англ. — Natural Language Processing (NLP)). Розглянуто аналоги розроблювальної авторами системи.
Розроблено метод виявлення та верифікації пріоритетних екологічних проблем у масивах вод басейну річки за нечіткими експертними оцінками, з урахуванням ймовірностей того, що процитовані експертом текстові матеріали дійсно відповідають зазначеній проблемі. Ці ймовірності визначаються з використанням моделей NLP-технологій. Охарактеризовано етапи функціонування експертної інформаційної веб-системи для реалізації запропонованої технології, яка дозволить одночасно зібрати максимально достовірну і детальну інформацію про об’єкти масивів вод та прискорити її опрацювання і ранжування.
Наведено приклад реалізації інформаційної веб-системи виявлення пріоритетних екологічних проблем у масивах вод басейну річки Південний Буг. Наведено приклади обчислення достовірності експертних оцінок із застосуванням авторської програми на Python на основі NLP-моделі BERT і логістичної регресії до реальної текстової інформації. The article considers the collection, verification and generalization of a large number of expert assessments of the cur-rent state of waters, existing environmental problems and influential factors that increase the risk of failure to achieve envi-ronmental goals of each volume of water during the development of river basin management plans (RBMPs) or stabilization of good ecological status of water in the water bodies of this basin. The task is complicated by the large number of such volumes of water, as it is extremely difficult to gather reliable information about the objects located in each of them. Creation of a web system with a map of water volumes and the involvement of a large number of experts from among locals who are not indifferent to the problems of their environment will help to solve this problem. However, then there is the problem of verifying the assessments of these experts, taking into account their different qualifications, experience, different views of the objectives of the RBMP, and the problem of how to compare them to identify the most vulnerable regions by different criteria. It is proposed that experts will be required not only expert assessments on the basis of single directories of possible answers, but also - links to text web resources that confirm their assessments to solve this problem. And then it will be ana-lyzed if these sources really confirm each assessment of the appropriate type of problem for a given region. The authors consider various approaches for comparing expert assessments both based on the basis of fuzzy sets and with the help of machine learning and natural language processing (NLP) technologies. Analogues of the system developed by the authors are considered.
A method has been developed to identify and verify priority of environmental problems in water bodies of the river basin based on fuzzy expert estimates, taking into account the probabilities that the text materials cited by the expert do corre-spond to this problem. These probabilities are determined to use models of NLP technologies. The stages of functioning of the expert information web system for the implementation of the proposed technology are described, which will simultane-ously collect the most reliable and detailed information about the objects of water bodies and accelerate its processing and ranking.
An example of the implementation of an information web system for identifying priority environmental problems in the water bodies of the Southern Bug River basin is given. Examples of calculating the reliability of expert estimates using the author’s program in Python based on NLP-model BERT and logistic regression which were applied to real text information are given. Рассмотрены вопросы сбора, верификации и обобщения большого количества экспертных оценок о реальном состоянии вод, имеющихся экологических проблемах и влияющих факторах, увеличивающих риск недостижения экологических целей каждым массивом вод при разработке программ мероприятий планов управления речного бассейна (ПУРБ), направленных на достижение или стабилизацию хорошего экологического состояния воды в массивах вод этого бассейна. Задача усложняется большим количеством таких массивов вод, поскольку со-брать достоверную информацию об объектах, расположенных в каждом из них, крайне трудно. Решить эту проблему позволит создание веб-системы с картой массивов вод и привлечением большого количества экспер-тов из числа местных жителей, неравнодушных к проблемам своей окружающей среды. Однако, тогда возника-ет проблема проверки достоверности оценок этих экспертов, учитывая их разную квалификацию, опыт рабо-ты, разное видение целей ПУРБ, и проблема как их сопоставлять, чтобы определить наиболее уязвимые регио-ны по различным критериям. Для этого предложено требовать от экспертов не просто экспертные оценки на основе единых справочников вариантов возможных ответов, но и ссылки на текстовые веб-ресурсы, подтвер-ждающие их оценки. А потом анализировать насколько эти источники действительно подтверждают каждую оценку относительно соответствующего типа проблемы для этого региона. Авторами рассмотрены различ-ные подходы для сопоставления экспертных оценок как на основе нечетких множеств, так и с помощью техно-логий машинного обучения и обработки естественного языка (англ. — Natural Language Processing (NLP)). Рас-смотрены аналоги разрабатываемой авторами системы.
Разработан метод выявления и верификации приоритетных экологических проблем в массивах вод бассейна реки с нечеткими экспертными оценками, с учетом вероятностей того, что процитированные экспертом тек-стовые материалы действительно соответствуют указанной проблеме. Эти вероятности определяются с использованием моделей NLP-технологий. Охарактеризованы этапы функционирования экспертной информацион-ной веб-системы для реализации предложенной технологии, которая позволит одновременно собрать максималь-но достоверную и подробную информацию об объектах массивов вод и ускорить ее обработку и ранжирование.
Приведен пример реализации информационной веб-системы выявления приоритетных экологических про-блем в массивах вод бассейна реки Южный Буг. Приведены примеры вычисления достоверности экспертных оценок с применением авторской программы на Python на основе NLP-модели BERT и логистической регрессии к реальной текстовой информации.
URI:
http://ir.lib.vntu.edu.ua//handle/123456789/31808