Побудова ГІС-інтегрованої системи даних та моделей на основі XML-формалізації для моделювання процесів у річках
Автор
Мокін, В. Б.
Скорина, Л. М.
Крижановський, Є. М.
Гораш, М. А.
Mokin, V.
Skoryna, L.
Kryzhanovskyi, Y.
Horash, M.
Мокин, В.
Скорина, Л.
Крыжановский, Е.
Хораш, Н.
Дата
2018Metadata
Показати повну інформаціюCollections
Анотації
Проведено аналіз відомих форматів формалізації математичних моделей та просторових форматів, які є актуальними для оброблення даних і моделювання процесів у річках: PMML, MathML, SBML, GML, WaterML, за системою критеріїв: кількість класів математичних моделей на прикладі задач моделювання процесів у річках; наявність репозиторіїв вже ідентифікованих моделей, інтегрування з мовами програмування; наявність специфічних тегів для роботи з просторовими даними; наявність середовищ для автоматизованої формалізації та імпорту/експорту XML-моделей. Запропоновано інтегральний критерій. Наведено приклади застосування цієї системи критеріїв для вибору оптимального XML-формату для збереження даних і моделей за різних ваг певних критеріїв та умов: якщо основним критерієм є наявність геоприв`язки, тоді оптимальною XML-мовою є WaterML, якщо – можливість формалізації будь-яких аналітичних моделей, особливо гідробіологічних, тоді – SBML, а якщо необхідною є автоматизація алгоритмів штучного інтелекту, тоді – PMML.
Охарактеризовано відомі технології збереження атрибутивних та просторових даних ГІС для їх автоматизованого оброблення: KML, Shapefile, GPX, GeoJSON, SXF, база геоданих ArcGIS, Spatialite (SQLite), MapInfo TAB format. Відзначено, що за критерієм кількості згадувань в документах зі словом «map», які знаходить пошукова система Google, найбільш популярними у світі є формати KML (22 млн.), GPX (20 млн.) та Shapefile (11,5 млн.).
Вперше запропоновано структуру ГІС-інтегрованої системи даних і моделей на основі XML-формалізації та проілюстровано її працездатність на прикладі прогнозування середньорічних витрат води для 50% забезпеченості за багаторічний період у басейні річки Дністер у середовищі KNIME Analytics Platform.
Отримані результати дозволяють забезпечити швидкість побудови, універсальність та широкий функціонал ГІС-інтегрованих систем баз даних і моделей. The paper presents the conducted analysis of the known formats for formalization of mathematical models and spatial formats which are relevant for processing data and models occurring in rivers, namely, PMML, MathML, SBML, GML, WaterML, according to the system of the following criteria:availability of repositories of the already identified models, integration with programming languages, availability of specific tags for working with spatial data, availability of environments for automated formalization and import/export of XML models. An integral criterion is proposed. Examples of using this criteria system for selection of the optimal XML format for storing data and models are presented for different weights of certain criteria and conditions: if availability of geo-reference is the main criterion, Water ML will the optimal XML language, if it is the possibility to formalize any analytical models, especially hydro-biological ones, then SBML will be the optimal choice and if automation of artificial intelligence algorithms is required, then PMML should be chosen.
The following known technologies for storing attributive and spatial data of GIS for their automated processing are characterized: KML, Shapefile, GPX, GeoJSON, SXF, ArcGIS geo-data base, Spatialite (SQLite), MapInfo TAB format. It is noted that by the criterion of the number of references with the word “map” found by Google search system such formats as KML (22 million), GPX (20 million) and Shapefile (11,5 million) are the most popular in the world.
GIS integrated system of data and models based on XML formalization is proposed for the first time and its operability is illustrated by the example of predicting average annual water consumption over a multiyear period for 50 % provision in the Dniester river basin in KNIME Analytics Platform environment.
The obtained results make it possible to provide fast construction, versatility and broad functional of GIS-integrated system of data and models. В работе представлен проведенный анализ известных форматов для формализации математических моделей и пространственных форматов, актуальных для обработки данных и моделей, встречающихся в реках, а именно PMML, MathML, SBML, GML, WaterML, по системе следующих критериев. : наличие репозиториев уже идентифицированных моделей, интеграция с языками программирования, наличие специальных тегов для работы с пространственными данными, наличие сред для автоматической формализации и импорта / экспорта моделей XML. Предложен интегральный критерий. Примеры использования этой системы критериев для выбора оптимального формата XML для хранения данных и моделей представлены для различных весов определенных критериев и условий: если доступность географической ссылки является основным критерием, Water ML будет оптимальным языком XML,
Охарактеризованы следующие известные технологии хранения атрибутивных и пространственных данных ГИС для их автоматической обработки: KML, Shapefile , GPX , GeoJSON , SXF , база геоданных ArcGIS, Spatialite (SQLite), формат TAB MapInfo. Отмечается, что по критерию количества ссылок со словом «карта», найденным поисковой системой Google, такие форматы, как KML (22 миллиона), GPX (20 миллионов) и Shapefile (11,5 миллиона), являются самыми популярными в мир.
Впервые предложена интегрированная система данных и моделей ГИС, основанная на формализации XML, и ее работоспособность проиллюстрирована на примере прогнозирования среднегодового потребления воды в течение многолетнего периода при 50% обеспеченности в бассейне реки Днестр в среде аналитической платформы KNIME.
Полученные результаты позволяют обеспечить быстрое построение, универсальность и широкий функционал ГИС-интегрированной системы данных и моделей.
URI:
http://ir.lib.vntu.edu.ua//handle/123456789/23413