Розробка методу розпізнавання українського мовлення медичного спрямування з перетворенням аудіозаписів у текст
Анотації
У роботі здійснено детальний аналіз методів розпізнавання українського медичного мовлення та перетворення аудіозаписів у текст. Дослідження охоплює визначення ключових понять, впливаючих на процес розпізнавання, та розробку технічного завдання для створення нового програмного засобу. Представлено архітектуру програмного забезпечення, включаючи графічний інтерфейс та модулі обробки мовлення, з використанням Python та сучасних технологій. Розкрито методику автоматизації збору датасету, що включає понад 2000 унікальних аудіозаписів, та описано високу точність розпізнавання медичних текстів за допомогою реалізованої системи з використанням моделі Whisper та техніки LoRA. Ефективність системи підтверджено через експериментальну апробацію та використання метрики WER. This research work conducts a detailed analysis of methods for recognizing Ukrainian medical speech and converting audio recordings into text. The study encompasses the identification of key concepts influencing the speech recognition process and the development of a technical task for creating a new software tool. The architecture of the software, including the graphical interface and speech processing modules, using Python and modern technologies, is presented. The methodology for automating the dataset collection, including over 2000 unique audio recordings, is revealed, and the high accuracy of medical text recognition using the implemented system with the Whisper model and
URI:
https://ir.lib.vntu.edu.ua//handle/123456789/47314

