• English
    • українська
  • English 
    • English
    • українська
  • Login
View Item 
  • Frontpage
  • Матеріали конференцій ВНТУ
  • Молодь в науці: дослідження, проблеми, перспективи
  • Молодь в науці: дослідження, проблеми, перспективи (МН-2024)
  • View Item
  • Frontpage
  • Матеріали конференцій ВНТУ
  • Молодь в науці: дослідження, проблеми, перспективи
  • Молодь в науці: дослідження, проблеми, перспективи (МН-2024)
  • View Item
Сайт інституційного репозитарію ВНТУ містить роботи, матеріали та файли, які були розміщені докторантами, аспірантами та студентами Вінницького Національного Технічного Університету. Для розширення функцій сайту рекомендується увімкнути JavaScript.

Розробка методу розпізнавання українського мовлення медичного спрямування з перетворенням аудіозаписів у текст

Author
Бісікало, О. В.
Петрук, П. О.
Date
2024
Metadata
Show full item record
Collections
  • Молодь в науці: дослідження, проблеми, перспективи (МН-2024) [896]
Abstract
У роботі здійснено детальний аналіз методів розпізнавання українського медичного мовлення та перетворення аудіозаписів у текст. Дослідження охоплює визначення ключових понять, впливаючих на процес розпізнавання, та розробку технічного завдання для створення нового програмного засобу. Представлено архітектуру програмного забезпечення, включаючи графічний інтерфейс та модулі обробки мовлення, з використанням Python та сучасних технологій. Розкрито методику автоматизації збору датасету, що включає понад 2000 унікальних аудіозаписів, та описано високу точність розпізнавання медичних текстів за допомогою реалізованої системи з використанням моделі Whisper та техніки LoRA. Ефективність системи підтверджено через експериментальну апробацію та використання метрики WER.
 
This research work conducts a detailed analysis of methods for recognizing Ukrainian medical speech and converting audio recordings into text. The study encompasses the identification of key concepts influencing the speech recognition process and the development of a technical task for creating a new software tool. The architecture of the software, including the graphical interface and speech processing modules, using Python and modern technologies, is presented. The methodology for automating the dataset collection, including over 2000 unique audio recordings, is revealed, and the high accuracy of medical text recognition using the implemented system with the Whisper model and
 
URI:
https://ir.lib.vntu.edu.ua//handle/123456789/47314
View/Open
19684.pdf (295.9Kb)

Institutional Repository

FrontpageSearchHelpContact UsAbout Us

University Resources

JetIQLibrary websiteUniversity websiteE-catalog of VNTU

Browse

All of DSpaceCommunities & CollectionsBy Issue DateAuthorsTitlesSubjectsTypePublisherLanguageUdcISSNPublicationDOIThis CollectionBy Issue DateAuthorsTitlesSubjectsTypePublisherLanguageUdcISSNPublicationDOI

My Account

LoginRegister

Statistics

View Usage Statistics

ISSN 2413-6360 | Frontpage | Send Feedback | Help | Contact Us | About Us
© 2016 Vinnytsia National Technical University | Extra plugins code by VNTU Linuxoids | Powered by DSpace
Працює за підтримки 
НТБ ВНТУ