Аналіз атак типу prompt Injection на великі мовні моделі

Клиш, В. М.; Куперштейн, Л. М.; Kupershtein, L. M.

Автор

Клиш, В. М.

Куперштейн, Л. М.

Kupershtein, L. M.

Дата

2025

Metadata

Показати повну інформацію

Collections

НТКП ВНТУ. Факультет інформаційних технологій та комп'ютерної інженерії (2025) [234]

Анотації

У роботі розглянуто проблему атак prompt injection на великі мовні моделі, зокрема їхні основні типи: прямі та непрямі ін’єкції. Проаналізовано можливі наслідки таких атак, зокрема ризики витоку даних і спотворення вихідних даних моделі. Запропоновано ефективні заходи захисту, спрямовані на зменшення вразливостей та підвищення безпеки використання LLM.

The paper considers the problem of prompt injection attacks on large language models, in particular their main types: direct and indirect injections. Possible consequences of such attacks are analysed, including the risks of data leakage and distortion of model output. Effective protection measures aimed at reducing vulnerabilities and increasing the security of LLM use are proposed.

URI:

https://ir.lib.vntu.edu.ua//handle/123456789/48606

Відкрити

24458.pdf (233.2Kb)