Модель та метод оцінювання надійності зразка клавіатурного почерку для поведінкової автентифікації користувача
Автор
Курніцький, Д. П.
Kurnitskiy, D. P.
Дата
2026Metadata
Показати повну інформаціюCollections
- JetIQ [287]
Анотації
This paper addresses the problem of estimating the reliability (sample quality) of the current keystroke-dynamics sample in behavioral user authentication at login time. Unlike risk-based fusion or context–behavior score combination, the focus is: “Can this particular behavioral sample be trusted enough to use the behavioral channel?” We provide a formal definition of sample reliability as a probabilistic estimate of sample usability/utility for biometric comparison, and propose a feature model capturing degradation factors: event completeness, effective sequence length, timing variability, autofill/paste indicators, device-change signals, and timestamp quantization/jitter. An integral reliability estimation method based on a logistic quality model is developed, and the relationship between estimated reliability and the behavioral verifier’s error is analyzed. We also discuss probability calibration (Platt scaling, isotonic regression, Bayesian binning) to convert raw scores into well-interpretable probabilities. Experimental validation is performed on the public DSL-StrongPassword benchmark dataset (51 users, 400 password typings per user) with controlled synthetic degradations (event loss, truncation, jitter/quantization). Results show that reliability-based filtering improves behavioral matching performance (AUC increases 0.856 to 0.890 for samples with q≥0.8 at ≈53% coverage) and changes the error profile, reducing false rejects for legitimate users in high-quality samples. Practical deployment recommendations for reliability thresholds and “use/do-not-use” gating policies are provided. Розглянуто задачу оцінювання надійності (якості) поточного зразка клавіатурного почерку (keystroke dynamics) у поведінкової автентифікації під час входу користувача. На відміну від робіт, що оптимізують рішення поведінкової автентифікації або злиття контексту й поведінки, у центрі дослідження — питання: «чи можна довіряти саме цьому зразку введення, щоб застосовувати поведінковий канал?» Запропоновано формальне означення надійності зразка як імовірнісної оцінки його придатності/корисності для біометричного зіставлення та наведено модель ознак деградації: повнота подій, ефективна довжина послідовності, варіативність таймінгів, індикатори автозаповнення/вставки, ознаки зміни пристрою й квантування часових міток. Розроблено метод інтегрального оцінювання надійності на основі логістичної моделі якості та показано, як надійність пов’язана зі зростанням помилок поведінкового верифікатора. Додатково розглянуто калібрування ймовірностей (Platt scaling, ізотонічна регресія, Bayesian binning) для перетворення «сирих» скорів у добре інтерпретовані ймовірності. Експериментальну перевірку виконано на відкритому еталонному датасеті DSL-StrongPassword (51 користувач, 400 введень пароля на користувача) із синтетичним моделюванням деградацій (втрата подій, укорочення послідовності, джиттер/квантування). Отримано, що відбір зразків за високими значеннями показника надійності підвищує якість поведінкового зіставлення (AUC зростає з 0.856 до 0.890 для підмножини зразків із q≥0.8 за покриття ≈53%), а також суттєво змінює профіль помилок, зменшуючи відмови для легітимних користувачів у «якісних» зразках. Наведено практичні рекомендації щодо порогів придатності та політик «використати/не використовувати» поведінковий канал у продакшн-системах.
URI:
https://ir.lib.vntu.edu.ua//handle/123456789/52099

