Аналіз атак типу prompt Injection на великі мовні моделі
Анотації
У роботі розглянуто проблему атак prompt injection на великі мовні моделі, зокрема їхні основні
типи: прямі та непрямі ін’єкції. Проаналізовано можливі наслідки таких атак, зокрема ризики витоку даних і
спотворення вихідних даних моделі. Запропоновано ефективні заходи захисту, спрямовані на зменшення вразливостей та підвищення безпеки використання LLM. The paper considers the problem of prompt injection attacks on large language models, in particular their
main types: direct and indirect injections. Possible consequences of such attacks are analysed, including the risks of data
leakage and distortion of model output. Effective protection measures aimed at reducing vulnerabilities and increasing
the security of LLM use are proposed.
URI:
https://ir.lib.vntu.edu.ua//handle/123456789/48606

