• English
    • русский
    • українська
  • русский 
    • English
    • русский
    • українська
  • Войти
Просмотр элемента 
  • Главная
  • Періодичні видання ВНТУ
  • Оптико-електронні інформаційно-енергетичні технології
  • Оптико-електронні інформаційно-енергетичні технології. 2017. № 2
  • Просмотр элемента
  • Главная
  • Періодичні видання ВНТУ
  • Оптико-електронні інформаційно-енергетичні технології
  • Оптико-електронні інформаційно-енергетичні технології. 2017. № 2
  • Просмотр элемента
Сайт інституційного репозитарію ВНТУ містить роботи, матеріали та файли, які були розміщені докторантами, аспірантами та студентами Вінницького Національного Технічного Університету. Для розширення функцій сайту рекомендується увімкнути JavaScript.

Підвищення інформативності основного тону для розпізнаванні мовців згортальними нейромережами

Автор
Биков, М. М.
Ковтун, В. В.
Дата
2017
Metadata
Показать полную информацию
Collections
  • Оптико-електронні інформаційно-енергетичні технології. 2017. № 2 [14]
Аннотации
У статті автори розробили метод і алгоритм виділення основного тону мовця із мовного сигналу, який використовує дані вейвлет-перетворення мовного сигналу та його сингулярного аналізу, що дозволяє довільно масштабувати представлення сигналу у частотній області і підвищує достовірність виділення основного тону у випадку присутності шумів у мовному сигналі і використанні для розпізнавання мовця загортальної нейромережі.
 
В статье авторы представили метод и алгоритм выделения основного тона диктора из речевого сигнала, использующий данные вейвлет-преобразования речевого сигнала и его сингулярного анализа, что позволяет произвольно масштабировать представление сигнала в частотной области и повышает достоверность выделения основного тона в случае присутствия шумов в речевом сигнале и использовании для распознавания диктора сверточной нейросети.
 
In the article the method and algorithm were presented for speaker’s pitch extraction from the speech signal, using the data of the wavelet transform and singular analysis of the speech signal. That allows arbitrary scale representation of the signal in the frequency domain and increases reliability allocation pitch in the case of noise present in the speech signal and using a convolution neural network for speaker recognition.
 
Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс:
http://ir.lib.vntu.edu.ua//handle/123456789/24716
Открыть
document (17).pdf (1.853Mb)

Институционный репозитарий

ГлавнаяПоискСправкаКонтактыО нас

Ресурсы

JetIQСайт библиотекиСайт университетаЭлектронный каталог ВНТУ

Просмотр

Весь DSpaceСообщества и коллекцииДата публикацииАвторыНазванияТематикаТипИздательствоЯзыкУДКISSNИздательства, что имеетDOIЭта коллекцияДата публикацииАвторыНазванияТематикаТипИздательствоЯзыкУДКISSNИздательства, что имеетDOI

Моя учетная запись

ВойтиРегистрация

Статистика

Просмотр статистики

ISSN 2413-6360 | Главная | Отправить отзыв | Справка | Контакты | О нас
© 2016 Vinnytsia National Technical University | Extra plugins code by VNTU Linuxoids | Powered by DSpace
Працює за підтримки 
НТБ ВНТУ