Система розпізнавання звукових сигналів немовленнєвого походження

Ткаченко, О. М.; Тютюнник, Я. О.; Чирва, П. В.; Комаров, В. Л.; Тютюнник, Я. А.; Tkachenko, O. M.; Tiutiunny, Ya. О.; Chyrva, P. V.; Komarov, V. L.

Author

Ткаченко, О. М.

Тютюнник, Я. О.

Чирва, П. В.

Комаров, В. Л.

Тютюнник, Я. А.

Tkachenko, O. M.

Tiutiunny, Ya. О.

Chyrva, P. V.

Komarov, V. L.

Date

2020

Metadata

Show full item record

Collections

Інформаційні технології та комп'ютерна інженерія. 2020. № 3 [8]

Abstract

Дана робота присвячена розробці програмного забезпечення, яке дало б змогу проводити розпізнавання звукових сигна- лів немовленнєвого походження. У статті проведений огляд існуючих на сьогоднішній день систем розпізнавання звуків, визначено їх переваги та недоліки. Приводиться список найбільш поширених алгоритмів, які можуть бути використанні для процесу навчання моделі та класифікації звуків. Більш детально розглядається модель гаусівського змішаного розподілу, яка і використовується для опису моделей звуків. Наводиться опис процесу розпізнавання звукових сигналів та їх подальша класифікація. Дана програма може використовуватись для аудіодетекції сигналів, наявних у базі даних. Продукт може використовуватись як самостійно, так і входити до складу програмно-апаратних комплаксів відповідного призначення. Використання засобів мови програмування C++ дозволило зробити його ефективним та зберегти швидкодію. Також наводиться статистика результатів розпізнавання та робиться висновок щодо ефективності системи.

Данная работа посвящена разработке программного обеспечения, которое позволило бы проводить распознавания звуковых сигналов неречевых происхождения. В статье проведен обзор существующих на сегодняшний день систем распознавания звуков выделены их преимущества и недостатки. Приводится список наиболее распространенных алгоритмов, которые могут быть использованы для процесса обучения модели и классификации звуков. Более подробно рассматривается модель гауссовского смешанного распределения, которая и используется для описания моделей звуков. Приводится описание процесса распознавания звуковых сигналов и их дальнейшая классификация. Данная программа может использоваться для аудиодетекции сигналов имею- щиеся в базе данных. Продукт может использоваться как самостоятельно, так и входить в состав программно-аппаратных комплек- сов соответствующего назначения. Использование средств языка программирования C ++ позволило сделать его эффективным и сохранить быстродействие. Также приводится статистика результатов распознавания и делается вывод об эффективности системы.

This work is devoted to the development of software that would allow the recognition of sound signals of non-speech origin. The article reviews the current sound recognition systems, identifies their advantages and disadvantages. The list of the most widespread algorithms which can be used for process of training of model and classification of sounds is resulted. The Gaussian mixed distribution model, which is used to describe the program's sound models, is considered in more detail. An overview of the process of recognition of sound signals and their further classification is given. This program can be used for audio detection of signals that are available in the database. The product can be used on its own or included in other more advanced recognition systems. Using the tools of the C ++ programming language allowed to make it efficient and maintain speed. Statistics of recognition results are also given and a conclusion on the efficiency of the system is made.

URI:

http://ir.lib.vntu.edu.ua//handle/123456789/31644

View/Open

Ткаченко.pdf (463.3Kb)