| dc.contributor.author | Мельник, О. В. | uk |
| dc.contributor.author | Чорний, О. В. | uk |
| dc.contributor.author | Середа, Д. О. | uk |
| dc.contributor.author | Melnyk, О. | uk |
| dc.date.accessioned | 2026-05-21T13:29:12Z | |
| dc.date.available | 2026-05-21T13:29:12Z | |
| dc.date.issued | 2026 | uk |
| dc.identifier.citation | Мельник О. В., Чорний О. В., Середа Д. О. Критерії та метрики безпеки при нефункціональному тестуванні систем генеративного штучного інтелекту // 4th International Scientific and Practical Conference «Advanced Technologies in Scientific Research», Rotterdam, Netherlands, May 13-15, 2026. Iss. № 70. Р. 358-364. DOI: https://doi.org/10.70286/ISU-13.05.2026. | uk |
| dc.identifier.isbn | 979-8-89704-977-6 | uk |
| dc.identifier.uri | https://ir.lib.vntu.edu.ua//handle/123456789/51641 | |
| dc.description.abstract | The paper examines security criteria and specific metrics for non-functional
testing of generative artificial intelligence systems. Traditional testing approaches fail
to adequately assess risks because the expected results of AI agents are no longer static
and span a continuously expanding space of valid outcomes. In critical domains, even
a single wrong recommendation generated by a model can have catastrophic
consequences. The application of specialized metrics, such as Toxicity Score,
Adversarial Accuracy, and Error Impact Coefficient, is analyzed. The necessity of
integrating ethical evaluation, robustness testing against misleading inputs, and
solution compliance validation against security rules (Red Teaming) into the nonfunctional testing process of AI solutions is demonstrated. | en_US |
| dc.description.abstract | У статті розглядаються критерії та специфічні метрики безпеки для
нефункціонального тестування систем на базі генеративного штучного
інтелекту. Традиційні підходи до тестування не здатні адекватно оцінити ризики,
оскільки очікувані результати ШІ-агентів не є статичними і охоплюють простір
дійсних результатів, що постійно розширюється. У критичних доменах навіть
одна неправильна рекомендація моделі може мати катастрофічні наслідки. Проаналізовано застосування спеціалізованих метрик, таких як оцінка
токсичності (Toxicity Score), змагальна стійкість (Adversarial Accuracy) та
коефіцієнт впливу помилок (Error Impact Coefficient). Доведено необхідність
інтеграції етичної оцінки, перевірки стійкості до оманливих запитів та оцінки
відповідності правилам безпеки (Red Teaming) у процес нефункціонального
тестування ШІ. | uk_UA |
| dc.language.iso | uk_UA | uk_UA |
| dc.publisher | International Scientific Unity | uk |
| dc.relation.ispartof | 4th International Scientific and Practical Conference «Advanced Technologies in Scientific Research», Rotterdam, Netherlands, May 13-15, 2026. Iss. № 70 : 358-364. | uk |
| dc.subject | генеративний штучний інтелект | uk |
| dc.subject | нефункціональне тестування | uk |
| dc.subject | безпека ШІ | uk |
| dc.subject | метрики безпеки | uk |
| dc.subject | галюцинації | uk |
| dc.subject | generative artificial intelligence | uk |
| dc.subject | non-functional testing | uk |
| dc.subject | AI safety | uk |
| dc.subject | safety metrics | uk |
| dc.subject | hallucinations | uk |
| dc.subject | Toxicity Score | uk |
| dc.subject | Adversarial Accuracy | uk |
| dc.subject | Error Impact Coefficient | uk |
| dc.subject | Retrieval-Augmented Generation | uk |
| dc.subject | LLM-as-a-judge | uk |
| dc.title | Критерії та метрики безпеки при нефункціональному тестуванні систем генеративного штучного інтелекту | uk |
| dc.type | Thesis | |
| dc.identifier.doi | https://doi.org/10.70286/ISU-13.05.2026 | uk |
| dc.identifier.orcid | https://orcid.org/0009-0002-9686-2838 | uk |