Show simple item record

dc.contributor.authorШтовба, С. Д.uk
dc.contributor.authorПетричко, О. М.uk
dc.date.accessioned2024-11-18T13:10:40Z
dc.date.available2024-11-18T13:10:40Z
dc.date.issued2021
dc.identifier.citationШтовба С. Д., Петричко О. М. Тематичне моделювання науковців на основі їх інтересів у Google Scholar. Системні дослідження та інформаційні технології. 2021. № 2. C. 113-129.uk
dc.identifier.issn1681–6048
dc.identifier.urihttps://ir.lib.vntu.edu.ua//handle/123456789/43566
dc.description.abstractЗапропоновано алгоритм тематичного моделювання науковців на основі їх інтересів в профілях в Google Scholar. Множиною тем моделювання обрано спеціальності системи класифікації наук ANZSRC – Australian and New Zealand Standard Research Classification. Розподіл науковців за спеціальностями здійснюється за статистикою вживання інтересів в категоризованих публікаціях з бази Dimensions. Тематичне моделювання проводиться на основі принципів статистичної підтримки, багатоярликовості, фільтрації шумів, ігнорування стоп-слів, солідарності, фокусування, компактності та взаємодії спеціальностей. Проведено порівняння тематичного моделювання на основі обмеженої інформації з профілів науковців з Google Scholar та за кількома десятками авторськими статями, які категоризовано системою Dimensions. Співпадіння оцінено за модифікованою метрикою Чекановського, яка враховує спорідненість спеціальностей. В результаті перевірки встановлено добру збіжність результатів тематичного моделювання на основі різного обсягу початкової інформації. Це дозволяє використовувати запропонований алгоритм як основу технології інформаційної розвідки стосовно наукових кадрів, зокрема, для первинного підбору кандидатів у опоненти дисертацій, у рецензенти наукових проєктів, для формування команди з виконання спільних наукових проєктів тощо.uk
dc.description.abstractThe article proposes an algorithm for topic modeling of researchers based on their interests from Google Scholar profiles. The algorithm uses the set of fields of research from research classification system ANZSRC. An information resource for topic modeling is a corpus of categorized publications from Dimensions. Interests from researchers’ profiles are used as search queries to Dimensions that outputs distributions of documents over categories. To reduce information noise these distributions are taken through a few stages of processing. The article also compares the results of topic modeling based on interests from Google Scholar profiles and based on a categorized list of publications from Dimensions. The comparison is done using modified Czekanowski metric that takes into account the similarity between categories. The results of comparing the topic modeling outputs based on different information sources show a good match.en
dc.language.isouk_UAuk_UA
dc.publisherКиївський політехнічний інститут імені Ігоря Сікорськогоuk
dc.relation.ispartofСистемні дослідження та інформаційні технології. № 2 : 113-129.uk
dc.relation.urihttp://journal.iasa.kpi.ua/article/view/225166/238486
dc.subjectтематичне моделюванняuk
dc.subjectкатегоризаціяuk
dc.subjectGoogle Scholaren
dc.subjectDimensionsen
dc.subjectANZSRCen
dc.subjectпрофіль науковцяuk
dc.subjectнаукові інтересиuk
dc.subjectметрика Чекановськогоuk
dc.subjectіндекс Жакараuk
dc.titleТематичне моделювання науковців на основі їх інтересів у Google Scholaruk
dc.typeArticle, professional native edition
dc.typeArticle
dc.identifier.udc519.254+001.2
dc.identifier.doihttps://doi.org/10.20535/SRIT.2308-8893.2021.2.09
dc.identifier.orcidhttps://orcid.org/0000-0003-1302-4899
dc.identifier.orcidhttps://orcid.org/0000-0001-6836-7843


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record