dc.contributor.author | Биков, М. М. | uk |
dc.contributor.author | Ковтун, В. В. | uk |
dc.date.accessioned | 2019-05-13T08:32:40Z | |
dc.date.available | 2019-05-13T08:32:40Z | |
dc.date.issued | 2017 | |
dc.identifier.citation | Биков М. М. Підвищення інформативності основного тону для розпізнаванні мовців згортальними нейромережами [Текст] / М. М. Биков, В. В. Ковтун // Оптико-електронні інформаційно-енергетичні технології. – 2017. – № 2. – С. 44-51. | uk |
dc.identifier.issn | 2311-2662 | |
dc.identifier.issn | 1681-7893 | |
dc.identifier.uri | http://ir.lib.vntu.edu.ua//handle/123456789/24716 | |
dc.description.abstract | У статті автори розробили метод і алгоритм виділення основного тону мовця із мовного сигналу, який використовує дані вейвлет-перетворення мовного сигналу та його сингулярного аналізу, що дозволяє довільно масштабувати представлення сигналу у частотній області і підвищує достовірність виділення основного тону у випадку присутності шумів у мовному сигналі і використанні для розпізнавання мовця загортальної нейромережі. | uk |
dc.description.abstract | В статье авторы представили метод и алгоритм выделения основного тона диктора из речевого сигнала, использующий данные вейвлет-преобразования речевого сигнала и его сингулярного анализа, что позволяет произвольно масштабировать представление сигнала в частотной области и повышает достоверность выделения основного тона в случае присутствия шумов в речевом сигнале и использовании для распознавания диктора сверточной нейросети. | ru |
dc.description.abstract | In the article the method and algorithm were presented for speaker’s pitch extraction from the speech signal, using the data of the wavelet transform and singular analysis of the speech signal. That allows arbitrary scale representation of the signal in the frequency domain and increases reliability allocation pitch in the case of noise present in the speech signal and using a convolution neural network for speaker recognition. | en |
dc.language.iso | uk_UA | uk_UA |
dc.publisher | ВНТУ | uk |
dc.relation.ispartof | Оптико-електронні інформаційно-енергетичні технології. № 2 : 44-51. | uk |
dc.relation.uri | https://oeipt.vntu.edu.ua/index.php/oeipt/article/view/482 | |
dc.subject | автоматизована система розпізнавання мовців критичного застосування | uk |
dc.subject | розпізнавання образів | uk |
dc.subject | цифрова обробка сигналів | uk |
dc.subject | сингулярний аналіз | uk |
dc.subject | згортальна нейромережа | uk |
dc.subject | вейвлет-перетворення | uk |
dc.title | Підвищення інформативності основного тону для розпізнаванні мовців згортальними нейромережами | uk |
dc.type | Article | |
dc.identifier.udc | 681.327.12 | |
dc.relation.references | Биков М. М., Ковтун В. В. Аналіз ефективності ідентифікації мовця за частотою основного тону // Вісник Хмельницького національного університету. – 2004. – № 2. – Ч. 1. – Т. 2(60). – С. 20-23. | uk |
dc.relation.references | Рабинер Л., Шафер Р. Цифровая обработка речевых сигналов. – М.: Радио и связь, 1981.– 496 с. | ru |
dc.relation.references | Новиков Л.В. Основы вейвлет-анализа сигналов. Учебное пособие. – СПб: ООО "МОДУС+", 1999. – 152 с. | ru |
dc.relation.references | Голяндина Н. Э. Метод “Гусеница”-SSA: Аналіз временных рядов: учеб. пособие / Н. Э. Голяндина. – СПб: Изд-во СПбГУ, 2004. – 76 с. | uk |
dc.relation.references | CS231n: Convolutional Neural Networks for Visual Recognition [Електронний ресурс] – Режим доступу: http://cs231n.github.io/convolutional-networks/ | uk |
dc.relation.references | Caffe | Deep Learning Framework [Електронний ресурс] – Режим доступу: http://caffe.berkeleyvision.org/. | uk |
dc.relation.references | An overview of gradient descent optimization algorithms [Електронний ресурс] – Режим доступу: http://sebastianruder.com/optimizing-gradient-descent/. | uk |
dc.relation.references | NOIZEUS: Noisy speech corpus – Univ. Texas-Dallas [Електронний ресурс] – Режим доступу: http://ecs.utdallas.edu/loizou/speech/noizeus/. | en |