| dc.contributor.author | Шибаєва, Н. О. | uk |
| dc.contributor.author | Шибаєв, Д. С. | uk |
| dc.contributor.author | Гришин, С. І. | uk |
| dc.contributor.author | Рудніченко, М. Д. | uk |
| dc.contributor.author | Вичужанін, В. В. | uk |
| dc.contributor.author | Shibaeva, N. O. | en |
| dc.contributor.author | Shibaev, D. S. | en |
| dc.contributor.author | Grishin, S. I. | en |
| dc.contributor.author | Rudnichenko, M. D. | en |
| dc.contributor.author | Vychuzhanin, V. V. | en |
| dc.date.accessioned | 2026-04-20T07:45:06Z | |
| dc.date.available | 2026-04-20T07:45:06Z | |
| dc.date.issued | 2025 | |
| dc.identifier.citation | Шибаєва Н. О., Шибаєв Д. С., Гришин С. І., Рудніченко М. Д., Вичужанін В. В. Гібридний підхід до пошуку та обробки складноструктурованих даних великого обсягу для побудови інтегрованого алгоритму аналізу культурної спадщини України // Вісник Вінницького політехнічного інституту. 2025. № 6. С. 127–138. URI: https://visnyk.vntu.edu.ua/index.php/visnyk/article/view/3382. | uk |
| dc.identifier.issn | 1997-9274 | |
| dc.identifier.uri | https://ir.lib.vntu.edu.ua//handle/123456789/51194 | |
| dc.description.abstract | The issue of preserving and analyzing Ukraine’s cultural heritage requires the development of the advanced intelligent tools capable of processing complex, multimodal, and heterogeneous data. Traditional methods of information retrieval and analysis often fail to account for the multilingual nature of archives, the presence of handwritten and poorly digitized documents, historical variations in terminology, and the necessity of fact verification, which significantly reduces the effectiveness of data integration diverse sources. To address these challenges, this study proposes a hybrid approach that combines multilevel web parsing, optical and handwritten text recognition (OCR/HTR), natural language processing (NLP) techniques, mechanisms for detecting duplicates and unreliable facts, and the construction of a knowledge graph employing clustering algorithms, PageRank, Apriori, and ARIMA. A distinctive feature of the proposed system is an adaptive search module enabling automated extraction, structuring, and verification of data, as well as an interactive map with geospatial visualization of cultural heritage figures, implemented using the Leaflet library and OpenStreetMap technologies. The architecture of the system supports multilayer data processing — normalization, lemmatization, and named entity recognition to semantic analysis, associative search, and predictive modeling of cultural and historical dynamics. Computational experiments confirmed the efficiency and scalability of the approach, demonstrating stable system performance in real-time conditions. The obtained results highlight the potential of the developed model as the foundation for a unified national information and retrieval system for Ukraine’s cultural heritage. The practical value of this hybrid framework extends to museum studies, archival science, education, and digital humanities research, ensuring standardized access to cultural data, enhancing analytical reliability, and fostering the integration of Ukrainian heritage into the global digital ecosystem. Further development of the system may involve the incorporation of multimodal data sources such as 3D models, audio archives, and blockchain-based provenance verification to strengthen data authenticity and long-term digital preservation. | en |
| dc.description.abstract | Проблематика збереження та аналізу культурної спадщини України вимагає створення сучасних інтелектуальних інструментів, здатних обробляти складноструктуровані, багатомодальні та різнотипні дані великого обсягу. Традиційні методи пошуку й аналізу інформації здебільшого не враховують багатомовність архівів, наявність рукописних документів, історичних варіацій термінології та необхідність верифікації фактів, що істотно знижує ефективність інтеграції відомостей з різних джерел. Для вирішення цих проблем у роботі запропоновано гібридний підхід на базі розробки інтегрованого алгоритму обробки та аналізу даних, який поєднує парсинг інтернет-ресурсів, методи оптичного та рукописного розпізнавання текстів, технології обробки природної мови, механізми виявлення дублікатів і недостовірних фактів, а також побудову графа знань з подальшим застосуванням алгоритмів кластеризації. Особливістю системи є наявність адаптивного пошукового модуля, що забезпечує автоматичне вилучення, структуризацію та перевірку даних, а також інтерактивна мапа з геоприв’язкою діячів культурної спадщини, реалізована засобами бібліотеки Leaflet і технологій OpenStreetMap. Архітектура системи передбачає багаторівневу обробку інформації — від нормалізації, лематизації та ідентифікації сутностей до семантичного аналізу, асоціативного пошуку та формування прогнозних моделей розвитку культурних процесів. Проведені обчислювальні експерименти підтвердили ефективність запропонованого підходу, що свідчить про придатність її використання у режимі реального часу. Отримані результати демонструють перспективність розробленої інформаційної системи для створення комплексної програмної платформи збору та збереження даних культурної спадщини України. Практичне застосування гібридного підходу охоплює музейну, архівну, освітню та наукову діяльність, забезпечуючи уніфікований доступ до цифрових джерел, підвищення достовірності аналітики й розвиток інфраструктури цифрової гуманітаристики. | uk |
| dc.language.iso | uk_UA | uk_UA |
| dc.publisher | ВНТУ | uk |
| dc.relation.ispartof | Вісник Вінницького політехнічного інституту. № 6 : 127–138. | uk |
| dc.relation.uri | https://visnyk.vntu.edu.ua/index.php/visnyk/article/view/3382 | |
| dc.subject | культурна спадщина | uk |
| dc.subject | обробка даних | uk |
| dc.subject | аналіз даних | uk |
| dc.subject | цифрові архіви | uk |
| dc.subject | cultural heritage | uk |
| dc.subject | data processing | uk |
| dc.subject | data analysis | en |
| dc.subject | Knowledge Graph | en |
| dc.subject | NER | en |
| dc.subject | BigData | en |
| dc.subject | digital archives | en |
| dc.title | Гібридний підхід до пошуку та обробки складноструктурованих даних великого обсягу для побудови інтегрованого алгоритму аналізу культурної спадщини України | uk |
| dc.title.alternative | Hybrid Approach to Searching and Processing of Complex Structured Big Data for Building an Integrated Algorithm for Ukraine’s Cultural Heritage Analyzing | en |
| dc.type | Article, professional native edition | |
| dc.type | Article | |
| dc.identifier.udc | 004.89:004.912 | |
| dc.relation.references | S. Barzaghi, A. Moretti, I. Heibi, and S. Peroni, “CHAD-KG: A knowledge graph for representing cultural heritage objects and digitisation paradata,” arXiv preprint, 2025. [Electronic resource]. Available:https://arxiv.org/abs/2505.13276. Accessed: 09-Oct-2025. | en |
| dc.relation.references | M. T. Biagetti, “An ontological model for the integration of cultural heritage information: CIDOC-CRM,” Italian Journal of Library, 2016. [Electronic resource]. Available: https://www.cidoc-crm.org/Resources/an-ontological-model-for-the-integration-of-cultural-heritage-information-cidoc-crm. Accessed: 09-Oct-2025. | en |
| dc.relation.references | H. El-Hajj and M. Valleriani, “Representing and validating cultural heritage knowledge graphs in CIDOC-CRM ontolo-gy,” Future Internet, vol. 13, no. 11, p. 277, 2021, https://doi.org/10.3390/fi13110277 . | en |
| dc.relation.references | M. Puren, and P. Vernus, “Towards a domain ontology for the analysis of ancient fabrics: The SILKNOW Project and the case of European silk heritage,” arXiv preprint, 2021. [Electronic resource]. Available: https://arxiv.org/abs/2112.15341. Ac-cessed: 09-Oct-202. | en |
| dc.relation.references | P. Fafalios, A. Kritsotaki, and M. Doerr, “The SeaLiT Ontology — an Extension of CIDOC-CRM for the Modelling and Integra-tion of Maritime History Information,” arXiv preprint, 2023. [Electronic resource]. Available: https://arxiv.org/abs/2301.04493. Accessed: 09-Oct-2025. | en |
| dc.relation.references | Z. Wang, and H. Song, “A fusion model for artwork identification based on convolutional neural networks and transform-ers,” arXiv preprint, 2025. [Electronic resource]. Available: https://arxiv.org/abs/2502.18083. Accessed: 09-Oct-2025. | en |
| dc.relation.references | T. Fan, H. Wang, and S. Deng, “Intangible cultural heritage image classification with multimodal attention and hierar-chical fusion,” Expert Systems with Applications, vol. 231, 2023, https://doi.org/10.1016/j.eswa.2023.120555 . | en |
| dc.relation.references | H. El-Hajj, and M. Valleriani, “CIDOC2VEC: Extracting information from atomized CIDOC-CRM humanities knowledge graphs,” Information, vol. 12, no. 12, p. 503, 2021, https://doi.org/10.3390/info12120503 . | en |
| dc.identifier.doi | https://doi.org/10.31649/1997-9266-2025-183-6-127-138 | |