Дослідження впливу параметрів великої мовної моделі на різноманітність згенерованого тексту

Мокін, В. Б.; Варер, Б. Ю.; Mokin, V. B.; Varer, B. Yu.

Author

Мокін, В. Б.

Варер, Б. Ю.

Mokin, V. B.

Varer, B. Yu.

Date

2025

Metadata

Show full item record

Collections

НТКП ВНТУ. Факультет інтелектуальних інформаційних технологій та автоматизації (2025) [171]

Abstract

Робота присвячена дослідженню впливу параметрів генерування (temperature та top_p) на різноманітність тексту, створеного великими мовними моделями. Запропоновано методологію оцінювання різних аспектів різноманітності на основі шести метрик, об'єднаних в єдиний показник. Результати експериментального дослідження 30 різних промптів із 36 комбінаціями параметрів для моделі Meta Llama 3.2 3B-instruct показали, що оптимальні значення різноманітності досягаються при помірних і високих значеннях temperature та top_p. Дослідження має практичне значення для формування якісних синтетичних датасетів, що зменшує ризик перенавчання моделей і покращує їхню узагальнюючу здатність.

The work is devoted to investigating the influence of generation parameters (temperature and top_p) on the diversity of text produced by large language models. A methodology is proposed for evaluating different aspects of diversity based on six metrics, combined into a single indicator. The results of an experimental study involving 30 different prompts and 36 parameter combinations for the Meta Llama 3.2 3B-instruct model showed that optimal diversity values are achieved with moderate and high settings of temperature and top_p. This research is of practical significance for creating highquality synthetic datasets, which reduces the risk of model overfitting and improves their ability to generalize.

URI:

https://ir.lib.vntu.edu.ua//handle/123456789/49239

View/Open

24236.pdf (688.0Kb)