Системний аналіз ефективності інтелектуальних методів для ідентифікації клінічних закономірностей у неструктурованих медичних текстах
Author
Бобко, Б. В.
Жуков, С. О.
Bobko, В.
Zhukov, S.
Date
2026Metadata
Show full item recordCollections
- Наукові роботи каф. САІТ [450]
Abstract
A systematic analysis of the effectiveness of modern intelligent methods based on natural
language processing (NLP) and machine learning for the automated identification of clinical patterns and typical
symptom complexes in unstructured medical texts. The study aims to summarise and comparatively evaluate existing
approaches to detecting frequency-based and context-sensitive patterns in clinical narratives, as well as to assess
the applicability of classical machine learning algorithms, deep learning models, hybrid approaches, and AutoML
platforms for binary, multiclass, and multilabel classification of symptoms and diagnoses. Special attention is given
to the role of contextual characteristics in improving the reliability of automated clinical text interpretation. Мета статті. Cистемний аналіз ефективності сучасних інтелектуальних методів обробки природної мови та машинного навчання для автоматизованої ідентифікації клінічних закономірностей і типових симптомокомплексів у неструктурованих медичних текстах. Робота спрямована на узагальнення та порівняльну оцінку підходів до виявлення частотних і контекстуальних патернів у клінічних записах, а також на визначення перспектив застосування класичних алгоритмів, глибокого навчання, гібридних моделей та AutoML-платформ у задачах багатокласової та багатоміткової класифікації симптомів і діагнозів. Окрему увагу приділено ролі контекстуальних характеристик у підвищенні достовірності автоматизованого аналізу клінічних текстів. Методологія. Дослідження виконано у формі систематичного огляду з використанням рекомендацій PRISMA. Пошук наукових публікацій здійснювався в базах даних PubMed, EMBASE та Scopus без обмежень за роком публікації, з урахуванням україномовних і англомовних джерел. Загальний масив становив 1993 унікальні записи після усунення дублікатів, з яких 38 статей було включено до фінального аналізу за визначеними критеріями. Проведено структурований відбір та ручне вилучення даних щодо типів клінічних корпусів, методів NLP, алгоритмів контекстного аналізу, моделей машинного навчання та метрик оцінювання. Додатково виконано кількісний аналіз частоти симптомів і симптомокомплексів, а також аналіз контекстуальних патернів із використанням лексичних правил і трансформаторних моделей. Наукова новизна. Наукова новизна роботи полягає у комплексному поєднанні частотного та контекстуального підходів до аналізу клінічних текстів із фокусом саме на симптомокомплекси, а не окремі симптоми. Уперше в межах одного дослідження здійснено порівняльний аналіз ефективності правил, класичних методів машинного навчання, глибоких нейронних мереж, гібридних підходів та AutoML-рішень для задач ідентифікації клінічних закономірностей. Показано критичну роль алгоритмів контекстного аналізу, зокрема ConText, у підвищенні точності автоматизованої інтерпретації клінічних станів та обґрунтовано доцільність використання F1-оцінки й AUC як базових інтегральних метрик для оцінювання багатокласових і багатоміткових моделей. Висновки. Результати системного аналізу свідчать, що найвищу ефективність у задачах ідентифікації клінічних закономірностей демонструють підходи, які поєднують статистичні ознаки з контекстночутливими моделями машинного навчання. Урахування заперечення, гіпотетичності та часових характеристик істотно зменшує кількість хибних спрацювань і підвищує інформативність автоматизованого аналізу клінічних текстів. Використання AutoML і трансформаторних моделей розширює можливості масштабування таких рішень у реальних умовах, однак потребує уваги до інтерпретованості та переносимості моделей. Отримані результати можуть бути використані для побудови систем підтримки клінічних рішень, моніторингу захворюваності та подальших досліджень у сфері інтелектуального аналізу медичних даних.
URI:
https://ir.lib.vntu.edu.ua//handle/123456789/51706

