Показати скорочену інформацію

dc.contributor.authorБісікало, О. В.uk
dc.contributor.authorПетрук, П. О.uk
dc.contributor.authorBisikalo, O.en
dc.contributor.authorPetruk, P.en
dc.date.accessioned2025-07-24T11:20:42Z
dc.date.available2025-07-24T11:20:42Z
dc.date.issued2024
dc.identifier.citationБісікало О. В., Петрук П. О. Розробка методу розпізнавання українського мовлення медичного спрямування з перетворенням аудіозаписів у текст // Матеріали Всеукраїнської науково-практичної інтернет-конференції «Молодь в науці: дослідження, проблеми, перспективи (МН-2024)», Вінниця, 11-20 травня 2024 р. Електрон. текст. дані. 2024. URI: https://conferences.vntu.edu.ua/index.php/mn/mn2024/paper/view/19684.uk
dc.identifier.isbn978-617-8163-14-3
dc.identifier.urihttps://ir.lib.vntu.edu.ua//handle/123456789/47314
dc.description.abstractУ роботі здійснено детальний аналіз методів розпізнавання українського медичного мовлення та перетворення аудіозаписів у текст. Дослідження охоплює визначення ключових понять, впливаючих на процес розпізнавання, та розробку технічного завдання для створення нового програмного засобу. Представлено архітектуру програмного забезпечення, включаючи графічний інтерфейс та модулі обробки мовлення, з використанням Python та сучасних технологій. Розкрито методику автоматизації збору датасету, що включає понад 2000 унікальних аудіозаписів, та описано високу точність розпізнавання медичних текстів за допомогою реалізованої системи з використанням моделі Whisper та техніки LoRA. Ефективність системи підтверджено через експериментальну апробацію та використання метрики WER.uk
dc.description.abstractThis research work conducts a detailed analysis of methods for recognizing Ukrainian medical speech and converting audio recordings into text. The study encompasses the identification of key concepts influencing the speech recognition process and the development of a technical task for creating a new software tool. The architecture of the software, including the graphical interface and speech processing modules, using Python and modern technologies, is presented. The methodology for automating the dataset collection, including over 2000 unique audio recordings, is revealed, and the high accuracy of medical text recognition using the implemented system with the Whisper model and LoRA technique is described. The system's efectiveness is confirmed through experimental testing and the use of the WER metric.en
dc.language.isouk_UAuk_UA
dc.publisherВНТУuk
dc.relation.ispartofМатеріали Всеукраїнської науково-практичної інтернет-конференції «Молодь в науці: дослідження, проблеми, перспективи (МН-2024)», Вінниця, 11-20 травня 2024 р.uk
dc.relation.urihttps://conferences.vntu.edu.ua/index.php/mn/mn2024/paper/view/19684
dc.subjectрозпізнавання українського медичного мовленняuk
dc.subjectперетворення аудіозапису у текстuk
dc.subjectобробка природної мовиuk
dc.subjectрозробка програмного забезпеченняuk
dc.subjectавтоматизація збору датасетуuk
dc.subjectLoRAuk, en
dc.subjectWhisperuk, en
dc.subjectWERuk, en
dc.subjectrecognition of Ukrainian medical speechen
dc.subjectconversion of audio recording into texten
dc.subjectnatural language processingen
dc.subjectsoftware developmenten
dc.subjectdataset collection automationen
dc.titleРозробка методу розпізнавання українського мовлення медичного спрямування з перетворенням аудіозаписів у текстuk
dc.typeThesis
dc.identifier.udc004.021
dc.relation.referencesБісікало О. Огляд аналогів програм та технологій для розпізнавання українського мовлення з перетворенням у текст / О.В. Бісікало, П.О. Петрук // Актуальні задачі медичної, біологічної фізики та інформатики : мат. статей Всеукр. наук.-практ. конф. з міжн. участю (27 квітня 2022 р., ВНМУ ім. М.І. Пирогова, м. Вінниця). – Вінниця : ВНМУ ім. М.І. Пирогова, 2022. – С.79-82.uk
dc.relation.referencesКрок - Підготовка до тестування та екзаменів. – Режим доступу: https://testkrok.org.ua/.uk
dc.relation.referencesGitHub. – Режим доступуhttps://github.com/openai/whisper.en
dc.relation.referencesExploring efficient-tuning methods in self-supervised speech models – Режим доступу: https://arxiv.org/pdf/2210.06175.pdfen
dc.relation.referencesTelegram – Режим доступу: https://t.me/Speech_to_Text_test_version_Bot.en


Файли в цьому документі

Thumbnail

Даний документ включений в наступну(і) колекцію(ї)

Показати скорочену інформацію