• English
    • українська
  • українська 
    • English
    • українська
  • Увійти
Дивитися документ 
  • Головна
  • Матеріали конференцій ВНТУ
  • Молодь в науці: дослідження, проблеми, перспективи
  • Молодь в науці: дослідження, проблеми, перспективи (МН-2024)
  • Дивитися документ
  • Головна
  • Матеріали конференцій ВНТУ
  • Молодь в науці: дослідження, проблеми, перспективи
  • Молодь в науці: дослідження, проблеми, перспективи (МН-2024)
  • Дивитися документ
Сайт інституційного репозитарію ВНТУ містить роботи, матеріали та файли, які були розміщені докторантами, аспірантами та студентами Вінницького Національного Технічного Університету. Для розширення функцій сайту рекомендується увімкнути JavaScript.

Розробка методу розпізнавання українського мовлення медичного спрямування з перетворенням аудіозаписів у текст

Автор
Бісікало, О. В.
Петрук, П. О.
Дата
2024
Metadata
Показати повну інформацію
Collections
  • Молодь в науці: дослідження, проблеми, перспективи (МН-2024) [896]
Анотації
У роботі здійснено детальний аналіз методів розпізнавання українського медичного мовлення та перетворення аудіозаписів у текст. Дослідження охоплює визначення ключових понять, впливаючих на процес розпізнавання, та розробку технічного завдання для створення нового програмного засобу. Представлено архітектуру програмного забезпечення, включаючи графічний інтерфейс та модулі обробки мовлення, з використанням Python та сучасних технологій. Розкрито методику автоматизації збору датасету, що включає понад 2000 унікальних аудіозаписів, та описано високу точність розпізнавання медичних текстів за допомогою реалізованої системи з використанням моделі Whisper та техніки LoRA. Ефективність системи підтверджено через експериментальну апробацію та використання метрики WER.
 
This research work conducts a detailed analysis of methods for recognizing Ukrainian medical speech and converting audio recordings into text. The study encompasses the identification of key concepts influencing the speech recognition process and the development of a technical task for creating a new software tool. The architecture of the software, including the graphical interface and speech processing modules, using Python and modern technologies, is presented. The methodology for automating the dataset collection, including over 2000 unique audio recordings, is revealed, and the high accuracy of medical text recognition using the implemented system with the Whisper model and
 
URI:
https://ir.lib.vntu.edu.ua//handle/123456789/47314
Відкрити
19684.pdf (295.9Kb)

Інституційний репозиторій

ГоловнаПошукДовідкаКонтактиПро нас

Ресурси

JetIQСайт бібліотекиСайт університетаЕлектронний каталог ВНТУ

Перегляд

Всі архівиСпільноти та колекціїЗа датою публікаціїАвторамиНазвамиТемамиТипВидавництвоМоваУДКISSNВидання, що міститьDOIЦя колекціяЗа датою публікаціїАвторамиНазвамиТемамиТипВидавництвоМоваУДКISSNВидання, що міститьDOI

Мій обліковий запис

ВхідРеєстрація

Статистика

View Usage Statistics

ISSN 2413-6360 | Головна | Відправити відгук | Довідка | Контакти | Про нас
© 2016 Vinnytsia National Technical University | Extra plugins code by VNTU Linuxoids | Powered by DSpace
Працює за підтримки 
НТБ ВНТУ