Показати скорочену інформацію

dc.contributor.authorШевчук, О. Ф.uk
dc.contributor.authorНечитайло, А. О.uk
dc.contributor.authorShevchuk, O.en
dc.contributor.authorNechytailo, A.en
dc.date.accessioned2026-06-23T10:42:06Z
dc.date.available2026-06-23T10:42:06Z
dc.date.issued2026
dc.identifier.citationШевчук О. Ф., Нечитайло А. О. Алгоритм виявлення дублікатів вакансій на основі семантичної схожості // Матеріали Міжнародної науково-практичної інтернет-конференції «Молодь в науці: дослідження, проблеми, перспективи (МН-2026)», м. Вінниця, 22-26 червня 2026 р. Електрон. текст. дані. 2026. URI: https://conferences.vntu.edu.ua/index.php/mn/mn2026/paper/view/29433.uk
dc.identifier.urihttps://ir.lib.vntu.edu.ua//handle/123456789/51922
dc.description.abstractThe paper explores the problem of intelligent filtering and data deduplication of job vacancies collected from unstructured sources. The algorithm for semantic analysis of job postings using high-dimensional numerical vectors is considered. A solution based on the OpenAI cloud API for generating embeddings and the pgvector extension for PostgreSQL DBMS is proposed, which allows detecting hidden duplicates of vacancies using the cosine similarity metric. Experimental validation showed a reduction in information noise by almost twice.en
dc.description.abstractУ роботі досліджено проблему інтелектуальної фільтрації та дедуплікації вакансій, зібраних із неструктурованих джерел. Розглянуто алгоритм семантичного аналізу текстів оголошень за допомогою багатовимірних числових векторів. Запропоновано рішення на основі хмарного API OpenAI для генерації векторних представлень та розширення pgvector для СУБД PostgreSQL, що дозволяє виявляти приховані копії вакансій за метрикою косинусної схожості. Експериментальна перевірка показала зниження рівня інформаційного шуму майже вдвічі.uk
dc.language.isouk_UAuk_UA
dc.publisherВНТУuk
dc.relation.ispartofМатеріали Міжнародної науково-практичної інтернет-конференції «Молодь в науці: дослідження, проблеми, перспективи (МН-2026)», м. Вінниця, 22-26 червня 2026 р.uk
dc.relation.urihttps://conferences.vntu.edu.ua/index.php/mn/mn2026/paper/view/29433
dc.subjectалгоритмuk
dc.subjectдедуплікація данихuk
dc.subjectкосинусна відстаньuk
dc.subjectвекторний пошукuk
dc.subjectобробка природної мовиuk
dc.subjectагрегація вакансійuk
dc.subjectdata deduplicationen
dc.subjectcosine distanceen
dc.subjectvector searchen
dc.subjectnatural language processingen
dc.subjectjob aggregationen
dc.titleАлгоритм виявлення дублікатів вакансій на основі семантичної схожостіuk
dc.typeThesis
dc.identifier.udc004.65
dc.relation.referencesOpenAI Platform Docs. Робота з векторними вбудовуваннями (Embeddings) за допомогою OpenAI API. Режим доступу: https://platform.openai.com/docs/guides/embeddings. – Дата звернення: 21.05.2026.en
dc.relation.referencesServBay Support. Посібник з використання розширення pgvector PostgreSQL. Режим доступу: https://support.servbay.com/uk/database-management/postgresql-extensions/pgvector. – Дата звернення: 21.05.2026.en
dc.relation.referencesMalkov Y. A., Yashunin D. A. Efficient and robust approximate nearest neighbor search using Hierarchical Navigable Small World graphs. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2020, Vol. 42, no. 4. P. 824–836.en


Файли в цьому документі

Thumbnail

Даний документ включений в наступну(і) колекцію(ї)

Показати скорочену інформацію