| dc.contributor.author | Шевчук, О. Ф. | uk |
| dc.contributor.author | Нечитайло, А. О. | uk |
| dc.contributor.author | Shevchuk, O. | en |
| dc.contributor.author | Nechytailo, A. | en |
| dc.date.accessioned | 2026-06-23T10:42:06Z | |
| dc.date.available | 2026-06-23T10:42:06Z | |
| dc.date.issued | 2026 | |
| dc.identifier.citation | Шевчук О. Ф., Нечитайло А. О. Алгоритм виявлення дублікатів вакансій на основі семантичної схожості // Матеріали Міжнародної науково-практичної інтернет-конференції «Молодь в науці: дослідження, проблеми, перспективи (МН-2026)», м. Вінниця, 22-26 червня 2026 р. Електрон. текст. дані. 2026. URI: https://conferences.vntu.edu.ua/index.php/mn/mn2026/paper/view/29433. | uk |
| dc.identifier.uri | https://ir.lib.vntu.edu.ua//handle/123456789/51922 | |
| dc.description.abstract | The paper explores the problem of intelligent filtering and data deduplication of job vacancies collected from
unstructured sources. The algorithm for semantic analysis of job postings using high-dimensional numerical vectors is
considered. A solution based on the OpenAI cloud API for generating embeddings and the pgvector extension for
PostgreSQL DBMS is proposed, which allows detecting hidden duplicates of vacancies using the cosine similarity
metric. Experimental validation showed a reduction in information noise by almost twice. | en |
| dc.description.abstract | У роботі досліджено проблему інтелектуальної фільтрації та дедуплікації вакансій, зібраних із неструктурованих джерел. Розглянуто алгоритм семантичного аналізу текстів оголошень за допомогою багатовимірних числових векторів. Запропоновано рішення на основі хмарного API OpenAI для генерації векторних представлень та розширення pgvector для СУБД PostgreSQL, що дозволяє виявляти приховані копії вакансій за метрикою косинусної схожості. Експериментальна перевірка показала зниження рівня інформаційного шуму майже вдвічі. | uk |
| dc.language.iso | uk_UA | uk_UA |
| dc.publisher | ВНТУ | uk |
| dc.relation.ispartof | Матеріали Міжнародної науково-практичної інтернет-конференції «Молодь в науці: дослідження, проблеми, перспективи (МН-2026)», м. Вінниця, 22-26 червня 2026 р. | uk |
| dc.relation.uri | https://conferences.vntu.edu.ua/index.php/mn/mn2026/paper/view/29433 | |
| dc.subject | алгоритм | uk |
| dc.subject | дедуплікація даних | uk |
| dc.subject | косинусна відстань | uk |
| dc.subject | векторний пошук | uk |
| dc.subject | обробка природної мови | uk |
| dc.subject | агрегація вакансій | uk |
| dc.subject | data deduplication | en |
| dc.subject | cosine distance | en |
| dc.subject | vector search | en |
| dc.subject | natural language processing | en |
| dc.subject | job aggregation | en |
| dc.title | Алгоритм виявлення дублікатів вакансій на основі семантичної схожості | uk |
| dc.type | Thesis | |
| dc.identifier.udc | 004.65 | |
| dc.relation.references | OpenAI Platform Docs. Робота з векторними вбудовуваннями (Embeddings) за допомогою OpenAI API.
Режим доступу: https://platform.openai.com/docs/guides/embeddings. – Дата звернення: 21.05.2026. | en |
| dc.relation.references | ServBay Support. Посібник з використання розширення pgvector PostgreSQL. Режим доступу:
https://support.servbay.com/uk/database-management/postgresql-extensions/pgvector. – Дата звернення: 21.05.2026. | en |
| dc.relation.references | Malkov Y. A., Yashunin D. A. Efficient and robust approximate nearest neighbor search using Hierarchical
Navigable Small World graphs. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2020, Vol. 42, no. 4.
P. 824–836. | en |