Програма для автоматизації створення відео з використанням генеративного штучного інтелекту
Author
Римар, П. В.
Колібабчук, Д. І.
Rymar, P. V.
Date
2025Metadata
Show full item recordCollections
- Наукові роботи каф. ПЗ [1654]
Abstract
The modern digital content market is growing dynamically, and the automation of video production is becoming increasingly relevant. With the popularity of platforms such as YouTube, TikTok, and Instagram, the demand for fast and high-quality video creation is rising. The standard video production process is time-consuming and requires significant human resources, especially for voiceover, editing, and visual content selection. The rapid development of artificial intelligence and its integration into various
fields open up new opportunities for automating content creation processes, particularly in video production. A crucial research area is the development of tools
that enable the automatic generation of videos based on textual materials, minimizing human involvement in the process.
This paper explores approaches to video generation automation using modern AI technologies. It analyzes the potential use of API tools such as Pexels and Jamendo for obtaining stock videos and music, OpenAI Whisper for transcription, Piper TTS and Coqui XTTS for voice generation, as well as MoviePy and FFmpeg for video processing. Special attention is given to generative models like Claude and Meta Llama, which are used for text analysis and its transformation into a structured format suitable for video content creation.
The aim of the study is to determine effective approaches to automated video generation based on textual materials, simplifying content creation and reducingtime and financial costs. The relevance of this work is driven by the increasing demand for video content in marketing, education, and media, where process automation is a key factor in improving productivity.
The research findings may be valuable for software developers, AI analysts, and digital content specialists interested in automating video creation. Сучасний ринок цифрового контенту динамічно зростає, і автоматизація відеовиробництва стає все більш актуальною. Завдяки популярності платформ на кшталт YouTube, TikTok і Instagram зростає попит на оперативне та якісне створення відео. Стандартний процес виробництва відео займає багато часу та потребує значних людських ресурсів, особливо коли йдеться про озвучення, монтаж і вибір візуального контенту. Швидкий розвиток штучного інтелекту та його інтеграція у різні сфери діяльності відкривають нові можливості для автоматизації процесів створення контенту, зокрема відеопродукції. Важливим напрямом досліджень є розробка
інструментів, які дозволяють автоматично генерувати відео на основі текстових матеріалів, мінімізуючи людське втручання у процес. У статті розглянуто підходи до автоматизації відеогенерації за допомогою сучасних AI-технологій. Проаналізовано можливості використання API-інструментів, таких як Pexels та Jamendo для отримання стокових відео й музики, OpenAI Whisper для транскрипції, Piper TTS та Coqui XTTS для генерації голосу, а також MoviePy і FFmpeg для обробки відео. Окрему увагу приділено генеративним моделям Claude та Meta Llama, які використовуються для аналізу тексту та його трансформації у структуровану форму,
придатну для створення відеоконтенту. Метою дослідження є визначення ефективних підходів до автоматизованої генерації відео на основі текстових матеріалів, що дозволить спростити процес створення контенту та скоротити часові й фінансові витрати на його виробництво. Актуальність роботи зумовлена зростаючим попитом на
відеоконтент у сфері маркетингу, освіти та медіа, де автоматизація процесів є важливим фактором підвищення продуктивності.
Результати дослідження можуть бути корисними для розробників програмного забезпечення, аналітиків штучного інтелекту та фахівців з цифрового контенту, які зацікавлені в автоматизації створення відео.
URI:
https://ir.lib.vntu.edu.ua//handle/123456789/48752