Показати скорочену інформацію

dc.contributor.authorДовгань, О. А.uk
dc.contributor.authorОвчинников, К. В.uk
dc.date.accessioned2024-12-04T14:50:57Z
dc.date.available2024-12-04T14:50:57Z
dc.date.issued2025
dc.identifier.citationДовгань О. А., Овчинников К. В. Алгоритми токенізації великих мовних моделей // Матеріали Всеукраїнської науково-практичної інтернет-конференції «Молодь в науці: дослідження, проблеми, перспективи (МН-2025)», Вінниця, 15-16 червня 2025 р. Електрон. текст. дані. Вінниця, 2025. URI: https://conferences.vntu.edu.ua/index.php/mn/mn2025/paper/download/22783.uk
dc.identifier.urihttps://ir.lib.vntu.edu.ua//handle/123456789/43691
dc.description.abstractThis work is dedicated to the review of algorithms for text tokenization of modern large language modelsen
dc.description.abstractДана робота присвячена огляду алгоритмів текстової токенізації сучасних великих мовних моделей.uk
dc.language.isouk_UAuk_UA
dc.publisherВНТУuk
dc.relation.ispartofМатеріали Всеукраїнської науково-практичної інтернет-конференції «Молодь в науці: дослідження, проблеми, перспективи (МН-2025)», Вінниця, 15-16 червня 2025 р.uk
dc.relation.urihttps://conferences.vntu.edu.ua/index.php/mn/mn2025/paper/download/22783
dc.subjectтокенізаціяuk
dc.subjectалгоритмuk
dc.subjectвелика мовна модельuk
dc.subjecttokenizationen
dc.subjectalgorithmen
dc.subjectlarge language modelen
dc.titleАлгоритми токенізації великих мовних моделейuk
dc.typeThesis
dc.identifier.udc004.9uk
dc.relation.referencesWhat is Tokenization? [Електронний ресурс] – Режим доступу: https://www.datacamp.com/blog/what-is-tokenizationen
dc.relation.referencesTokenizer Choice For LLM Training: Negligible or Crucial? [Електронний ресурс] – Режим доступу: https://aclanthology.org/2024.findings-naacl.247/en
dc.relation.referencesNeural Machine Translation of Rare Words with Subword Units [Електронний ресурс] – Режим доступу: https://arxiv.org/abs/1508.07909v5en
dc.relation.referencesGoogle's Neural Machine Translation System: Bridging the Gap between Human and Machine Translation [Електронний ресурс] – Режим доступу: https://arxiv.org/abs/1609.08144v2en
dc.relation.referencesSentencePiece: A simple and language independent subword tokenizer and detokenizer for Neural Text Processing [Електронний ресурс] – Режим доступу: https://arxiv.org/abs/1808.06226v1en
dc.relation.referencestiktoken [Електронний ресурс] – Режим доступу: https://github.com/openai/tiktokenen
dc.relation.referencesThe Llama 3 Herd of Models [Електронний ресурс] – Режим доступу: https://arxiv.org/abs/2407.21783en


Файли в цьому документі

Thumbnail

Даний документ включений в наступну(і) колекцію(ї)

Показати скорочену інформацію