• English
    • українська
  • українська 
    • English
    • українська
  • Увійти
Дивитися документ 
  • Головна
  • Науково-технічна бібліотека
  • Публікації співробітників бібліотеки
  • JetIQ
  • Дивитися документ
  • Головна
  • Науково-технічна бібліотека
  • Публікації співробітників бібліотеки
  • JetIQ
  • Дивитися документ
Сайт інституційного репозитарію ВНТУ містить роботи, матеріали та файли, які були розміщені докторантами, аспірантами та студентами Вінницького Національного Технічного Університету. Для розширення функцій сайту рекомендується увімкнути JavaScript.

Method of multi-purpose term search in the terminology database

Автор
Yarovyi, A. А.
Kudriavtsev, D. S.
Яровий, А. А.
Кудрявцев, Д. С.
Дата
2024
Metadata
Показати повну інформацію
Collections
  • JetIQ [455]
Анотації
This study investigated the method of multi-purpose term search in a terminological knowledge base, which is based on semantic analysis and the use of modern natural language processing methods. The study considered the key factors affecting the search efficiency, including the structure of data organisation, data format and parameters, and sample size. Particular focus was placed on the semantic similarity between terms, which allows increasing the search accuracy by using vector representations and the Louvain algorithm. The study also described the use of cosine similarity to quantify the similarity between terms. Furthermore, the search process was optimised by filtering relevant databases and dynamically identifying relevant terms using the modularity metric. A comparative analysis of existing methods for searching for terms by the identified factors was conducted. The study noted the advantages and disadvantages of using the Louvain algorithm in comparison with the search algorithms in graph data structures. A series of experiments were conducted on data samples, including dictionary, graph, and network data structures. The study analysed the use of logistic constraints for searching in network data structures and noted the possibility of optimisation due to uniform and dynamic data distribution. Experimental results showed the effectiveness of using a combination of the Louvain algorithm and network data structures in terminological knowledge bases. Examples of the scope of application of this method in information technologies for searching and processing text data were given. A software architecture scheme with the use of a software interface and the possibility of integration for web applications in the form of a package or library was developed. The proposed approach demonstrates effectiveness in the context of intelligent decision support systems and automated chatbots, which makes it particularly useful for industries access to accurate professional terms is critical. A basic version of the software interface for using this method in information technologies for searching and analysing data for use in search engines was developed
 
У цьому дослідженні досліджувався метод багатоцільового пошуку термінів у термінологічній базі знань, який базується на семантичному аналізі та використанні сучасних методів обробки природної мови. У дослідженні розглянуто ключові фактори, що впливають на ефективність пошуку, включаючи структуру організації даних, формат та параметри даних, а також розмір вибірки. Особливу увагу було приділено семантичній подібності між термінами, що дозволяє підвищити точність пошуку за допомогою векторних представлень та алгоритму Лувена. У дослідженні також описано використання косинусної подібності для кількісної оцінки подібності між термінами. Крім того, процес пошуку було оптимізовано шляхом фільтрації релевантних баз даних та динамічної ідентифікації релевантних термінів за допомогою метрики модульності. Було проведено порівняльний аналіз існуючих методів пошуку термінів за виявленими факторами. У дослідженні зазначено переваги та недоліки використання алгоритму Лувена порівняно з алгоритмами пошуку в графових структурах даних. Було проведено серію експериментів на вибірках даних, включаючи словникові, графові та мережеві структури даних. У дослідженні проаналізовано використання логістичних обмежень для пошуку в мережевих структурах даних та зазначено можливість оптимізації завдяки рівномірному та динамічному розподілу даних. Експериментальні результати показали ефективність використання комбінації алгоритму Лувена та мережевих структур даних у термінологічних базах знань. Наведено приклади сфери застосування цього методу в інформаційних технологіях для пошуку та обробки текстових даних. Розроблено схему архітектури програмного забезпечення з використанням програмного інтерфейсу та можливістю інтеграції для веб-додатків у вигляді пакета або бібліотеки. Запропонований підхід демонструє ефективність у контексті інтелектуальних систем підтримки рішень та автоматизованих чат-ботів, що робить його особливо корисним для галузей, де доступ до точних професійних термінів є критичним. Розроблено базову версію програмного інтерфейсу для використання цього методу в інформаційних технологіях для пошуку та аналізу даних для використання в пошукових системах.
 
URI:
https://ir.lib.vntu.edu.ua//handle/123456789/46722
Відкрити
179762.pdf (773.4Kb)

Інституційний репозиторій

ГоловнаПошукДовідкаКонтактиПро нас

Ресурси

JetIQСайт бібліотекиСайт університетаЕлектронний каталог ВНТУ

Перегляд

Всі архівиСпільноти та колекціїЗа датою публікаціїАвторамиНазвамиТемамиТипВидавництвоМоваУДКISSNВидання, що міститьDOIЦя колекціяЗа датою публікаціїАвторамиНазвамиТемамиТипВидавництвоМоваУДКISSNВидання, що міститьDOI

Мій обліковий запис

ВхідРеєстрація

Статистика

View Usage Statistics

ISSN 2413-6360 | Головна | Відправити відгук | Довідка | Контакти | Про нас
© 2016 Vinnytsia National Technical University | Extra plugins code by VNTU Linuxoids | Powered by DSpace
Працює за підтримки 
НТБ ВНТУ