Критерії та метрики безпеки при нефункціональному тестуванні систем генеративного штучного інтелекту

Мельник, О. В.; Чорний, О. В.; Середа, Д. О.; Melnyk, О.

dc.contributor.author	Мельник, О. В.	uk
dc.contributor.author	Чорний, О. В.	uk
dc.contributor.author	Середа, Д. О.	uk
dc.contributor.author	Melnyk, О.	uk
dc.date.accessioned	2026-05-21T13:29:12Z
dc.date.available	2026-05-21T13:29:12Z
dc.date.issued	2026	uk
dc.identifier.citation	Мельник О. В., Чорний О. В., Середа Д. О. Критерії та метрики безпеки при нефункціональному тестуванні систем генеративного штучного інтелекту // 4th International Scientific and Practical Conference «Advanced Technologies in Scientific Research», Rotterdam, Netherlands, May 13-15, 2026. Iss. № 70. Р. 358-364. DOI: https://doi.org/10.70286/ISU-13.05.2026.	uk
dc.identifier.isbn	979-8-89704-977-6	uk
dc.identifier.uri	https://ir.lib.vntu.edu.ua//handle/123456789/51641
dc.description.abstract	The paper examines security criteria and specific metrics for non-functional testing of generative artificial intelligence systems. Traditional testing approaches fail to adequately assess risks because the expected results of AI agents are no longer static and span a continuously expanding space of valid outcomes. In critical domains, even a single wrong recommendation generated by a model can have catastrophic consequences. The application of specialized metrics, such as Toxicity Score, Adversarial Accuracy, and Error Impact Coefficient, is analyzed. The necessity of integrating ethical evaluation, robustness testing against misleading inputs, and solution compliance validation against security rules (Red Teaming) into the nonfunctional testing process of AI solutions is demonstrated.	en_US
dc.description.abstract	У статті розглядаються критерії та специфічні метрики безпеки для нефункціонального тестування систем на базі генеративного штучного інтелекту. Традиційні підходи до тестування не здатні адекватно оцінити ризики, оскільки очікувані результати ШІ-агентів не є статичними і охоплюють простір дійсних результатів, що постійно розширюється. У критичних доменах навіть одна неправильна рекомендація моделі може мати катастрофічні наслідки. Проаналізовано застосування спеціалізованих метрик, таких як оцінка токсичності (Toxicity Score), змагальна стійкість (Adversarial Accuracy) та коефіцієнт впливу помилок (Error Impact Coefficient). Доведено необхідність інтеграції етичної оцінки, перевірки стійкості до оманливих запитів та оцінки відповідності правилам безпеки (Red Teaming) у процес нефункціонального тестування ШІ.	uk_UA
dc.language.iso	uk_UA	uk_UA
dc.publisher	International Scientific Unity	uk
dc.relation.ispartof	4th International Scientific and Practical Conference «Advanced Technologies in Scientific Research», Rotterdam, Netherlands, May 13-15, 2026. Iss. № 70 : 358-364.	uk
dc.subject	генеративний штучний інтелект	uk
dc.subject	нефункціональне тестування	uk
dc.subject	безпека ШІ	uk
dc.subject	метрики безпеки	uk
dc.subject	галюцинації	uk
dc.subject	generative artificial intelligence	uk
dc.subject	non-functional testing	uk
dc.subject	AI safety	uk
dc.subject	safety metrics	uk
dc.subject	hallucinations	uk
dc.subject	Toxicity Score	uk
dc.subject	Adversarial Accuracy	uk
dc.subject	Error Impact Coefficient	uk
dc.subject	Retrieval-Augmented Generation	uk
dc.subject	LLM-as-a-judge	uk
dc.title	Критерії та метрики безпеки при нефункціональному тестуванні систем генеративного штучного інтелекту	uk
dc.type	Thesis
dc.identifier.doi	https://doi.org/10.70286/ISU-13.05.2026	uk
dc.identifier.orcid	https://orcid.org/0009-0002-9686-2838	uk

Файли в цьому документі

Ім'я:: 201730.pdf
Розмір:: 500.2Kb
Формат:: PDF

Відкрити

Даний документ включений в наступну(і) колекцію(ї)

JetIQ [181]

Показати скорочену інформацію