Методи машинного навчання для виявлення аномалій у медичній статистиці України: аналітичний огляд
Автор
Бобко, Б. В.
Жуков, С. О.
Bobko, B. V.
Zhukov, S. O.
Дата
2025Metadata
Показати повну інформаціюCollections
- JetIQ [190]
Анотації
detect anomalies in medical statistical data. Contemporary approaches to anomaly detection
in large-scale medical information–encompassing both aggregated health-care indicators
and patient-level records – are analysed. The principal anomaly types (point, contextual and
collective) are defined, and detection techniques are classified into supervised, semi-supervised
and unsupervised categories, with emphasis on the latter owing to the scarcity of labelled data.
The study reviews algorithms and models employed to identify atypical observations: statistical
tests, distance- and density-based metrics, clustering methods, one-class classifiers, ensemble
techniques (e.g., Isolation Forest) and deep neural networks (autoencoders). Illustrative
applications show how these methods enhance data quality by locating erroneous entries or abnormal indicator values and uncover unusual patterns that may signal emergent phenomena
such as disease outbreaks or health-care fraud. The literature synthesis demonstrates that
machine-learning-driven anomaly detection automates the identification process and markedly
reduces the time experts spend on manual data verification. Such methods have been successfully
implemented both internationally and in Ukraine, notably for quality control of medical statistics.
Machine learning methods also demonstrate potential in forecasting trends and assessing risks
in medical systems, enhancing their role in the digital transformation of healthcare. Hence,
machine-learning methodology constitutes an effective instrument for detecting anomalies
in medical statistics, enabling timely identification of data errors and atypical situations and
thereby strengthening evidence-based decision-making in the health-care sector. У статті розглянуто теоретичні засади застосування методів машинного навчання
для виявлення аномалій у медичних статистичних даних. Проаналізовано сучасні підходи
до детектування аномалій у великих масивах медичної інформації, включаючи агреговані
показники охорони здоров’я та дані пацієнтів. Визначено основні типи аномалій (точкові,
контекстні, колективні) та класифіковано методи виявлення аномалій (контрольовані,
напівконтрольовані, неконтрольовані) з акцентом на останніх, що найчастіше застосову- ються через брак розмічених даних. Розглянуто алгоритми і моделі машинного навчання,
які використовуються для пошуку нетипових спостережень: статистичні, метрики
близькості, кластерні, однокласові класифікатори, ансамблеві методи (наприклад,
Isolation Forest) та глибокі нейронні мережі (автоенкодери). Наведено приклади вико- ристання таких методів для підвищення якості медичних даних (виявлення помилкових
записів, аномальних значень показників) та для виявлення незвичних патернів, що можуть
сигналізувати про нові явища (спалахи захворювань, шахрайство у сфері охорони здоров’я
тощо). Узагальнення літератури показало, що використання методів машинного нав- чання дозволяє автоматизувати процес виявлення аномалій і значно скоротити час, який
витрачається фахівцями на перевірку даних вручну. Відповідні методи успішно застосо- вано як за кордоном, так і в Україні, зокрема для контролю якості медичної статистики.
Методи машинного навчання також демонструють потенціал у прогнозуванні тенденцій
та оцінці ризиків у медичних системах, що посилює їхню роль у цифровій трансформації
охорони здоров’я. Методологія машинного навчання є ефективним інструментом для зна- ходження аномалій у медичній статистиці, що сприяє своєчасному виявленню помилок
даних та нестандартних ситуацій, підвищуючи обґрунтованість управлінських рішень
у сфері охорони здоров’я.
URI:
https://ir.lib.vntu.edu.ua//handle/123456789/49988

