| dc.contributor.author | Хрущак, С. В. | uk |
| dc.contributor.author | Tкaченко, O. M. | uk |
| dc.contributor.author | Колесник, І. С. | uk |
| dc.contributor.author | Khruschak, S. V. | en |
| dc.contributor.author | Tkachenko, O. М. | en |
| dc.contributor.author | Kolesnyk, I. S. | en |
| dc.date.accessioned | 2026-02-03T11:07:12Z | |
| dc.date.available | 2026-02-03T11:07:12Z | |
| dc.date.issued | 2025 | |
| dc.identifier.citation | Хрущак С. В., Tкaченко O. M., Колесник І. С., Tkachenko O. М. Підвищення ефективності rag для побудови наукових інтелектуальних баз знань // Оптико-електроннi iнформацiйно-енергетичнi технологiї. 2025. № 1. С. 89-97. URI: https://oeipt.vntu.edu.ua/index.php/oeipt/article/view/762. | uk |
| dc.identifier.issn | 2311-2662 | |
| dc.identifier.uri | https://ir.lib.vntu.edu.ua//handle/123456789/50577 | |
| dc.description.abstract | The article describes the development of an intellectual knowledge base based on scientific articles using large language models in the mode of generation by augmented search. Various methods of increasing the relevance of the sample of cited sources and generated answers of the language model and the choice of approaches to building language generative systems taking into account the specifics of scientific materials in Ukrainian and English are investigated. The use of different language models for generating answers is also considered. In the course of the study, a set of criteria for a comprehensive evaluation of generative systems was ed and recommendations for building scientific intellectual knowledge bases were provided.
An intelligent agent has been developed that allows searching and analyzing scientific articles and providing document citations in a convenient interactive form.В статті розглядається розбробка інтелектуальної бази знань на основі наукових статей з використанням великих мовних моделей в режимі генерації доповненої пошуком. Досліджено різні методи підвищення релевантності вибірки цитованих джерел та згенерованих відповідей мовної моделі та вибір підходів до побудови мовних генеративних систем з врахуванням специфіки наукових матеріалів українською та англійською мовами. Також розглянуто використання різних мовних моделей для генерації відповідей. В процесі дослідження обрано набір критеріїв для комплексного оцінювання генеративних систем та надано рекомендації для побудови наукових інтелектуальних баз знань.
Розроблено інтелектуального агента, який дозволяє проводити пошук та аналізувати наукові статті у зручній інтерактивній формі з забезпеченням цитувань оригінальних документів. | uk |
| dc.language.iso | uk_UA | uk_UA |
| dc.publisher | ВНТУ | uk |
| dc.relation.ispartof | Оптико-електроннi iнформацiйно-енергетичнi технологiї. № 1 : 89-97. | uk |
| dc.relation.uri | https://oeipt.vntu.edu.ua/index.php/oeipt/article/view/762 | |
| dc.subject | штучний інтелект | uk |
| dc.subject | база знань | uk |
| dc.subject | великі мовні моделі | uk |
| dc.subject | LLM | en |
| dc.subject | генерація доповнена пошуком | uk |
| dc.subject | RAG. | en |
| dc.subject | artificial intelligence | en |
| dc.subject | large language models | en |
| dc.subject | LLM | en |
| dc.subject | retrieval augmented generation | en |
| dc.subject | RAG | en |
| dc.subject | knowledge base. | en |
| dc.title | Підвищення ефективності RAG для побудови наукових інтелектуальних баз знань | uk |
| dc.title.alternative | RAG efficiency improvement for building intellectual scientific knownledge databases | en |
| dc.type | Article, professional native edition | |
| dc.type | Article, | |
| dc.identifier.udc | 004.75 | |
| dc.relation.references | Andriopoulos, K. and Johan, P. (2023). Augmenting LLMs with knowledge: a survey on hallucination prevention. arXiv. URL: https://doi.org/10.48550/arXiv.2309.16459. | en |
| dc.relation.references | Wang, Chenguang, Mu Li, and Alexander J. Smola. Language models with transformers. arXiv preprint arXiv:1904.09408 (2019). URL: https://doi.org/10.48550/arXiv.1904.09408. | en |
| dc.relation.references | Jeong, Cheonsu (2023). A study on the implementation of generative AI services using an enterprise data-based LLM application architecture. arXiv. URL: https://doi.org/10.48550/arXiv.2309. | en |
| dc.relation.references | Brown, T., Mann, B., Ryder, N., Subbiah, M., Kaplan, J. D., Dhariwal, P. and Neelakantan, A. (2020). Language models are few-shot learners. Advances in Neural Information Processing Systems 33, 1877–1901. DOI: https://doi.org/10.48550/arXiv.2005.14165. | en |
| dc.relation.references | Cui, J., Li, Z., Yan, Y., Chen, B. and Yuan, L. (2023). ChatLaw: open-source legal large language model with integrated external knowledge bases. DOI: https://doi.org/10.48550/arXiv.2306.16092. | en |
| dc.relation.references | Tolga Şakar, Hakan Emekci, Maximizing RAG efficiency: A comparative analysis of RAG methods / Natural Language Processing, Cambridge, Vol. 31, Issue 1, 2025, pp. 1-25. | en |
| dc.relation.references | Toni Taipalus. Vector database management systems: Fundamental concepts, use-cases, and current challenges / Cognitive Systems Research, Vol. 85, 2024. DOI: https://doi.org/10.1016/j.cogsys.2024.101216. | en |
| dc.relation.references | Roucher A. RAG Evaluation. URL: https://huggingface.co/learn/cookbook/rag_evaluation. | en |
| dc.relation.references | Herreros Q., Veasey T., Papaoikonomou T. RAG evaluation metrics: A journey through metrics. URL: https://www.elastic.co/search-labs/blog/evaluating-rag-metrics. | en |
| dc.relation.references | Trotman A., Puurula A., Burgess B.. Improvements to BM25 and Language Models Examined. In Proc., 19th Australasian Document Computing Symp., ADCS ’14, 58–65. New York: Association for Computing Machinery. | en |
| dc.relation.references | Chen, W., Chen, J., Zou, F., Li, Y.-F., Lu, P. and Zhao, W. (2019). RobustiQ: a robust ANN search method for billion-scale similarity search on GPUs. Proceedings of the 2019 International Conference On Multimedia Retrieval (pp. 132–140). URL: https://doi.org/10.1145/3323873.3325018. | en |
| dc.identifier.doi | https://doi.org/10.31649/1681-7893-2025-49-1-89-97 | |