Показати скорочену інформацію

dc.contributor.authorМокін, В. Б.uk
dc.contributor.authorБондалєтов, К. О.uk
dc.contributor.authorКрижановський, Є. М.uk
dc.contributor.authorКараваєв, В. О.uk
dc.date.accessioned2023-11-02T14:56:41Z
dc.date.available2023-11-02T14:56:41Z
dc.date.issued2023uk
dc.identifier.citationМетод аугментації текстів про стан масивів вод на основі інтелектуальної прив`язки до багатозв`язних геоінформаційних систем іменованих сутностей [Текст] / В. Б. Мокін, К. О. Бондалєтов, Є. М. Крижановський, і В. О. Караваєв // Вісник Вінницького політехнічного інчтитуту. – 2023. – Вип. 3. – С. 55–65.uk
dc.identifier.issn1997–9266uk
dc.identifier.urihttp://ir.lib.vntu.edu.ua//handle/123456789/38074
dc.description.abstractThe article is dedicated to the augmentation of Ukrainian-language texts about the state of surface water bodies in a river basin for the training of machine learning models that should automatically annotate these texts, i. e. referencing in space and time and performing their classification. The authors describe the progress made in creating the "Water Information System with Spatial and Temporal Referencing for the Southern Bug Basin" ("WISEST-SBB"), which is being populated with annotated data on the state of water bodies in the river basin using technologies and algorithms developed by the authors earlier. It is noted that the experience has shown a lack of information for training machine learning models intended for automating its annotation. An analysis of modern methods of text data augmentation applicable to Ukrainian texts has been conducted, highlighting their drawbacks, primarily the high probability of synthesizing unreliable information. The proposed approach suggests augmenting data on water bodies of a river network, considering the propagation of reliable information about one water body to others located upstream or downstream or otherwise connected to them. To formalize and automate this process, a new formalization of the river network in the form of a multi-related geoinformation system of named entities (MGISNE) is proposed, which involves identifying named entities among all objects and then establishing spatial relationships between them. Examples of MGISNE are described, including hydrographic or ecological networks, networks of administrative entities, and others. The previously proposed recursive algorithm for referencing water body data with named entities in MGISNE is improved, and its formalized description is developed. After referencing texts with water bodies, the augmentation of the texts is proposed with subsequent verification of the results in a semi-automated manner, which can later be made more automated. The results of the proposed method, algorithm, and approaches in the WISEST-SBB system are characterized, demonstrating their effectiveness. The findings of this work can be extended to other types of MGISNE, both for basins of other rivers and systems of a different character.en_US
dc.description.abstractДосліджено аугментацію україномовних текстів про стан масивів поверхневих вод басейну річки для тренування інтелектуальних моделей машинного навчання, які повинні автоматично розмічати ці тексти, тобто прив`язувати у просторі й часі та здійснювати їхню класифікацію. Охарактеризовано стан створення авторами статті системи «Водна інформаційна система з просторовою і часовою прив`язкою для басейну Південного Бугу» («WISEST Southern Bug Basin» — «WISEST-SBB»), яка наповнюється розміченими даними про стан масивів вод басейну річки з використанням технологій та алгоритмів, розробленими авторами раніше. Зазначено, що досвід показав недостатність інформації для тренування інтелектуальних моделей машинного навчання, призначених для автоматизації її розмітки. Проведено аналіз сучасних методів аугментації текстової інформації, які можна застосувати до україномовних текстів, та відмічено їхні недоліки, передусім — високу ймовірність синтезу недостовірної інформації. Запропоновано здійснювати аугментацію даних про масиви вод річкової мережі з урахуванням поширення достовірної інформації про одні масиви вод на інші, розташовані вище чи нижче за течією, або зв`язані з ними в інший спосіб. Для формалізації та автоматизації цього процесу запропоновано нову формалізацію річкової мережі у вигляді багатозв`язної геоінформаційної системи іменованих сутностей (БГСІС), яка передбачає виділення серед усіх об`єктів саме іменованих сутностей, а потім встановлення просторових зв`язків між ними. Охарактеризовано приклади БГСІС у вигляді гідрографічної чи екологічної мережі, мережі адміністративних утворень тощо. Удосконалено раніше запропонований авторами рекурсивний алгоритм прив`язування даних про масиви вод до іменованих сутностей БГСІС та розроблено його формалізований опис. Після прив`язування текстів до масивів вод запропоновано здійснювати їхню аугментацію з подальшою верифікацією результатів в напівавтоматизований спосіб, який, згодом, теж можна зробити автоматизованішим. Охарактеризовано результати апробації запропонованого методу, алгоритму та підходів у системі «WISEST-SBB», які довели їхню ефективність. Результати роботи можуть бути поширені й на інші типи БГСІС — як на басейни інших річок, так і на системи іншого характеру.uk_UA
dc.language.isouk_UAuk_UA
dc.publisherВНТУuk
dc.relation.ispartofВісник Вінницького політехнічного інституту. № 3 : 55–65.uk
dc.subjectаугментація текстівuk
dc.subjectіменовані сутностіuk
dc.subjectпросторові даніuk
dc.subjectбагатозв`язні геоінформаційні системиuk
dc.subjectаналітична веб-системаuk
dc.subjectінтелектуальна технологіяuk
dc.subjectоброблення природномовного текстуuk
dc.subjecttext augmentationuk
dc.subjectnatural language processinguk
dc.subjectNLPuk
dc.subjectnamed entitiesuk
dc.subjectspatial datauk
dc.subjectmulti-related geoinformation systemsuk
dc.subjectanalytical web systemsuk
dc.subjectintelligent technologyuk
dc.titleМетод аугментації текстів про стан масивів вод на основі інтелектуальної прив`язки до багатозв`язних геоінформаційних систем іменованих сутностейuk
dc.typeArticle
dc.identifier.udc004.9+556uk
dc.relation.referenceshttps://visnyk.vntu.edu.ua/index.php/visnyk/article/view/2887uk
dc.identifier.doihttps://doi.org/10.31649/1997-9266-2023-168-3-55-65uk
dc.identifier.orcidhttps://orcid.org/0000-0003-1946-0202uk


Файли в цьому документі

Thumbnail

Даний документ включений в наступну(і) колекцію(ї)

Показати скорочену інформацію