Розробка erp-застосунку для діаризації мовленнєвих команд
Анотації
Авторами розроблено консольний додаток для діаризації мовних сигналів на мові python. В основу додатка покладено попередньо створена загальна схема голосової біометрії GMM+i-vec+DNN. Точність діаризації для нашого додатку на вибірці 80 зразків 40-ка різних дикторів склала 93%. Щодо швидкості, то середня тривалість обробки голосу при навчанні системи склала 22 секунди (оброблювалося файл з вимовою тривалістю 20 секунд). The authors have developed a console application for diarization of speech signals in Python. The application is based on the previously created general scheme of voice biometrics GMM + i-vec + DNN. The accuracy of diarrhea for our application in a sample of 80 samples from 40 different speakers was 93%. In terms of speed, the average duration of voice processing when learning the system was 22 seconds (processed a file with a pronunciation duration of 20 seconds).
URI:
https://ir.lib.vntu.edu.ua//handle/123456789/45959