Показати скорочену інформацію

dc.contributor.authorМельник, О. В.uk
dc.contributor.authorЧорний, О. В.uk
dc.contributor.authorСереда, Д. О.uk
dc.contributor.authorMelnyk, О.uk
dc.date.accessioned2026-05-21T13:29:12Z
dc.date.available2026-05-21T13:29:12Z
dc.date.issued2026uk
dc.identifier.citationМельник О. В., Чорний О. В., Середа Д. О. Критерії та метрики безпеки при нефункціональному тестуванні систем генеративного штучного інтелекту // 4th International Scientific and Practical Conference «Advanced Technologies in Scientific Research», Rotterdam, Netherlands, May 13-15, 2026. Iss. № 70. Р. 358-364. DOI: https://doi.org/10.70286/ISU-13.05.2026.uk
dc.identifier.isbn979-8-89704-977-6uk
dc.identifier.urihttps://ir.lib.vntu.edu.ua//handle/123456789/51641
dc.description.abstractThe paper examines security criteria and specific metrics for non-functional testing of generative artificial intelligence systems. Traditional testing approaches fail to adequately assess risks because the expected results of AI agents are no longer static and span a continuously expanding space of valid outcomes. In critical domains, even a single wrong recommendation generated by a model can have catastrophic consequences. The application of specialized metrics, such as Toxicity Score, Adversarial Accuracy, and Error Impact Coefficient, is analyzed. The necessity of integrating ethical evaluation, robustness testing against misleading inputs, and solution compliance validation against security rules (Red Teaming) into the nonfunctional testing process of AI solutions is demonstrated.en_US
dc.description.abstractУ статті розглядаються критерії та специфічні метрики безпеки для нефункціонального тестування систем на базі генеративного штучного інтелекту. Традиційні підходи до тестування не здатні адекватно оцінити ризики, оскільки очікувані результати ШІ-агентів не є статичними і охоплюють простір дійсних результатів, що постійно розширюється. У критичних доменах навіть одна неправильна рекомендація моделі може мати катастрофічні наслідки. Проаналізовано застосування спеціалізованих метрик, таких як оцінка токсичності (Toxicity Score), змагальна стійкість (Adversarial Accuracy) та коефіцієнт впливу помилок (Error Impact Coefficient). Доведено необхідність інтеграції етичної оцінки, перевірки стійкості до оманливих запитів та оцінки відповідності правилам безпеки (Red Teaming) у процес нефункціонального тестування ШІ.uk_UA
dc.language.isouk_UAuk_UA
dc.publisherInternational Scientific Unityuk
dc.relation.ispartof4th International Scientific and Practical Conference «Advanced Technologies in Scientific Research», Rotterdam, Netherlands, May 13-15, 2026. Iss. № 70 : 358-364.uk
dc.subjectгенеративний штучний інтелектuk
dc.subjectнефункціональне тестуванняuk
dc.subjectбезпека ШІuk
dc.subjectметрики безпекиuk
dc.subjectгалюцинаціїuk
dc.subjectgenerative artificial intelligenceuk
dc.subjectnon-functional testinguk
dc.subjectAI safetyuk
dc.subjectsafety metricsuk
dc.subjecthallucinationsuk
dc.subjectToxicity Scoreuk
dc.subjectAdversarial Accuracyuk
dc.subjectError Impact Coefficientuk
dc.subjectRetrieval-Augmented Generationuk
dc.subjectLLM-as-a-judgeuk
dc.titleКритерії та метрики безпеки при нефункціональному тестуванні систем генеративного штучного інтелектуuk
dc.typeThesis
dc.identifier.doihttps://doi.org/10.70286/ISU-13.05.2026uk
dc.identifier.orcidhttps://orcid.org/0009-0002-9686-2838uk


Файли в цьому документі

Thumbnail

Даний документ включений в наступну(і) колекцію(ї)

Показати скорочену інформацію