Aplicação de redes neurais recorrentes no reconhecimento automático da fala em ambientes com ruídos
Autor(a) principal: | |
---|---|
Data de Publicação: | 2017 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFS |
Texto Completo: | http://ri.ufs.br/jspui/handle/riufs/10760 |
Resumo: | Many learning tasks require dealing with sequential data, such as text translators, music generators, and more. Deep Neural Networks have shown promising results in automatic speech recognition, where one of the main challenges is voice recognition signals in the presence of noise. In this manuscript, we combine two known deep learning architectures, Convolutional Neural Networks for acoustic modeling, and a recurrent architecture with Classification Temporal Conexionist for sequential modeling. Recurrent Neural Networks (RNN) are models that capture sequence dynamics through a topology that contains cycles, unlike acyclic neural networks or feedforward networks. The RNN studied in this work is a particular case of a deep learning network that, unlike its shallow correlates, it is able to retain a state that can represent information from an arbitrarily long context window. The experimental results showed that the proposed architecture achieved superior performance when compared to Hidden Markov Model in tests carried out on the same databases. |
id |
UFS-2_82ea543620f926b0660ec7744895cf15 |
---|---|
oai_identifier_str |
oai:ufs.br:riufs/10760 |
network_acronym_str |
UFS-2 |
network_name_str |
Repositório Institucional da UFS |
repository_id_str |
|
spelling |
Santana, Luciana Maiara Queiroz deMatos, Leonardo Nogueira2019-03-25T23:09:10Z2019-03-25T23:09:10Z2017-07-26SANTANA, Luciana Maiara Queiroz de. Aplicação de redes neurais recorrentes no reconhecimento automático da fala em ambientes com ruídos. 2017. 68 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Sergipe, São Cristóvão, SE, 2017.http://ri.ufs.br/jspui/handle/riufs/10760Many learning tasks require dealing with sequential data, such as text translators, music generators, and more. Deep Neural Networks have shown promising results in automatic speech recognition, where one of the main challenges is voice recognition signals in the presence of noise. In this manuscript, we combine two known deep learning architectures, Convolutional Neural Networks for acoustic modeling, and a recurrent architecture with Classification Temporal Conexionist for sequential modeling. Recurrent Neural Networks (RNN) are models that capture sequence dynamics through a topology that contains cycles, unlike acyclic neural networks or feedforward networks. The RNN studied in this work is a particular case of a deep learning network that, unlike its shallow correlates, it is able to retain a state that can represent information from an arbitrarily long context window. The experimental results showed that the proposed architecture achieved superior performance when compared to Hidden Markov Model in tests carried out on the same databases.Inúmeras tarefas de aprendizagem exigem lidar com dados sequenciais, a exemplo de tradutores de textos, geradores de músicas, entre outros. Os sistemas que utilizam redes neurais profundas têm mostrado resultados promissores no reconhecimento automático de fala, onde um dos maiores desafios é o reconhecimento em sinais de voz contaminados com ruído. Para este trabalho, combinamos duas arquiteturas conhecidas de aprendizagem profunda, as redes neurais convolucionais para abordagem acústica e uma arquitetura recorrente com classificação temporal conexionista para modelagem sequencial. As redes neurais recorrentes são modelos que capturam a dinâmica da sequência através de uma topologia que contém ciclos, ao contrário das redes neurais acíclicas ou de alimentação direta (feedforward). O modelo estudado neste trabalho é um caso particular de rede recorrente profunda que, ao contrário de seus correlatos de arquitetura rasa, é capaz de reter um estado que pode representar informações de uma janela de contexto arbitrariamente longa. Os resultados experimentais mostraram que a arquitetura proposta alcançou um desempenho superior quando comparado ao modelo clássico, modelo oculto de Markov, em testes realizados sobre as mesmas bases de dados.São Cristóvão, SEporReconhecimento automático de vozRuído aditivoAprendizado profundoRede Neural Recorrente (RNN)Automatic Speech Recognition (ASR)Additive noiseDeep learningRecurrent Neural Network (RNN)CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOAplicação de redes neurais recorrentes no reconhecimento automático da fala em ambientes com ruídosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisPós-Graduação em Ciência da ComputaçãoUFSreponame:Repositório Institucional da UFSinstname:Universidade Federal de Sergipe (UFS)instacron:UFSinfo:eu-repo/semantics/openAccessTEXTLUCIANA_MAIARA_QUEIROZ_SANTANA.pdf.txtLUCIANA_MAIARA_QUEIROZ_SANTANA.pdf.txtExtracted texttext/plain138738https://ri.ufs.br/jspui/bitstream/riufs/10760/3/LUCIANA_MAIARA_QUEIROZ_SANTANA.pdf.txt42764e8439ee008ef78c7f7aff0c792bMD53THUMBNAILLUCIANA_MAIARA_QUEIROZ_SANTANA.pdf.jpgLUCIANA_MAIARA_QUEIROZ_SANTANA.pdf.jpgGenerated Thumbnailimage/jpeg1354https://ri.ufs.br/jspui/bitstream/riufs/10760/4/LUCIANA_MAIARA_QUEIROZ_SANTANA.pdf.jpgc576da86d49d9fe2800043d11b639ce3MD54LICENSElicense.txtlicense.txttext/plain; charset=utf-81475https://ri.ufs.br/jspui/bitstream/riufs/10760/1/license.txt098cbbf65c2c15e1fb2e49c5d306a44cMD51ORIGINALLUCIANA_MAIARA_QUEIROZ_SANTANA.pdfLUCIANA_MAIARA_QUEIROZ_SANTANA.pdfapplication/pdf11148256https://ri.ufs.br/jspui/bitstream/riufs/10760/2/LUCIANA_MAIARA_QUEIROZ_SANTANA.pdf1025158244aab1d7bb685026a2cd26cdMD52riufs/107602019-03-25 20:09:10.907oai:ufs.br:riufs/10760TElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEKCkNvbSBhIGFwcmVzZW50YcOnw6NvIGRlc3RhIGxpY2Vuw6dhLCB2b2PDqiAobyBhdXRvcihlcykgb3UgbyB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvcikgY29uY2VkZSDDoCBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBTZXJnaXBlIG8gZGlyZWl0byBuw6NvLWV4Y2x1c2l2byBkZSByZXByb2R1emlyIHNldSB0cmFiYWxobyBubyBmb3JtYXRvIGVsZXRyw7RuaWNvLCBpbmNsdWluZG8gb3MgZm9ybWF0b3Mgw6F1ZGlvIG91IHbDrWRlby4KClZvY8OqIGNvbmNvcmRhIHF1ZSBhIFVuaXZlcnNpZGFkZSBGZWRlcmFsIGRlIFNlcmdpcGUgcG9kZSwgc2VtIGFsdGVyYXIgbyBjb250ZcO6ZG8sIHRyYW5zcG9yIHNldSB0cmFiYWxobyBwYXJhIHF1YWxxdWVyIG1laW8gb3UgZm9ybWF0byBwYXJhIGZpbnMgZGUgcHJlc2VydmHDp8Ojby4KClZvY8OqIHRhbWLDqW0gY29uY29yZGEgcXVlIGEgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZGUgU2VyZ2lwZSBwb2RlIG1hbnRlciBtYWlzIGRlIHVtYSBjw7NwaWEgZGUgc2V1IHRyYWJhbGhvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrLXVwIGUgcHJlc2VydmHDp8Ojby4KClZvY8OqIGRlY2xhcmEgcXVlIHNldSB0cmFiYWxobyDDqSBvcmlnaW5hbCBlIHF1ZSB2b2PDqiB0ZW0gbyBwb2RlciBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4gVm9jw6ogdGFtYsOpbSBkZWNsYXJhIHF1ZSBvIGRlcMOzc2l0bywgcXVlIHNlamEgZGUgc2V1IGNvbmhlY2ltZW50bywgbsOjbyBpbmZyaW5nZSBkaXJlaXRvcyBhdXRvcmFpcyBkZSBuaW5ndcOpbS4KCkNhc28gbyB0cmFiYWxobyBjb250ZW5oYSBtYXRlcmlhbCBxdWUgdm9jw6ogbsOjbyBwb3NzdWkgYSB0aXR1bGFyaWRhZGUgZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCB2b2PDqiBkZWNsYXJhIHF1ZSBvYnRldmUgYSBwZXJtaXNzw6NvIGlycmVzdHJpdGEgZG8gZGV0ZW50b3IgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIHBhcmEgY29uY2VkZXIgw6AgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZGUgU2VyZ2lwZSBvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgbmVzdGEgbGljZW7Dp2EsIGUgcXVlIGVzc2UgbWF0ZXJpYWwgZGUgcHJvcHJpZWRhZGUgZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3Ugbm8gY29udGXDumRvLgoKQSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBTZXJnaXBlIHNlIGNvbXByb21ldGUgYSBpZGVudGlmaWNhciBjbGFyYW1lbnRlIG8gc2V1IG5vbWUocykgb3UgbyhzKSBub21lKHMpIGRvKHMpIApkZXRlbnRvcihlcykgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIGRvIHRyYWJhbGhvLCBlIG7Do28gZmFyw6EgcXVhbHF1ZXIgYWx0ZXJhw6fDo28sIGFsw6ltIGRhcXVlbGFzIGNvbmNlZGlkYXMgcG9yIGVzdGEgbGljZW7Dp2EuIAo=Repositório InstitucionalPUBhttps://ri.ufs.br/oai/requestrepositorio@academico.ufs.bropendoar:2019-03-25T23:09:10Repositório Institucional da UFS - Universidade Federal de Sergipe (UFS)false |
dc.title.pt_BR.fl_str_mv |
Aplicação de redes neurais recorrentes no reconhecimento automático da fala em ambientes com ruídos |
title |
Aplicação de redes neurais recorrentes no reconhecimento automático da fala em ambientes com ruídos |
spellingShingle |
Aplicação de redes neurais recorrentes no reconhecimento automático da fala em ambientes com ruídos Santana, Luciana Maiara Queiroz de Reconhecimento automático de voz Ruído aditivo Aprendizado profundo Rede Neural Recorrente (RNN) Automatic Speech Recognition (ASR) Additive noise Deep learning Recurrent Neural Network (RNN) CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
title_short |
Aplicação de redes neurais recorrentes no reconhecimento automático da fala em ambientes com ruídos |
title_full |
Aplicação de redes neurais recorrentes no reconhecimento automático da fala em ambientes com ruídos |
title_fullStr |
Aplicação de redes neurais recorrentes no reconhecimento automático da fala em ambientes com ruídos |
title_full_unstemmed |
Aplicação de redes neurais recorrentes no reconhecimento automático da fala em ambientes com ruídos |
title_sort |
Aplicação de redes neurais recorrentes no reconhecimento automático da fala em ambientes com ruídos |
author |
Santana, Luciana Maiara Queiroz de |
author_facet |
Santana, Luciana Maiara Queiroz de |
author_role |
author |
dc.contributor.author.fl_str_mv |
Santana, Luciana Maiara Queiroz de |
dc.contributor.advisor1.fl_str_mv |
Matos, Leonardo Nogueira |
contributor_str_mv |
Matos, Leonardo Nogueira |
dc.subject.por.fl_str_mv |
Reconhecimento automático de voz Ruído aditivo Aprendizado profundo Rede Neural Recorrente (RNN) Automatic Speech Recognition (ASR) Additive noise Deep learning Recurrent Neural Network (RNN) |
topic |
Reconhecimento automático de voz Ruído aditivo Aprendizado profundo Rede Neural Recorrente (RNN) Automatic Speech Recognition (ASR) Additive noise Deep learning Recurrent Neural Network (RNN) CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
dc.subject.cnpq.fl_str_mv |
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
description |
Many learning tasks require dealing with sequential data, such as text translators, music generators, and more. Deep Neural Networks have shown promising results in automatic speech recognition, where one of the main challenges is voice recognition signals in the presence of noise. In this manuscript, we combine two known deep learning architectures, Convolutional Neural Networks for acoustic modeling, and a recurrent architecture with Classification Temporal Conexionist for sequential modeling. Recurrent Neural Networks (RNN) are models that capture sequence dynamics through a topology that contains cycles, unlike acyclic neural networks or feedforward networks. The RNN studied in this work is a particular case of a deep learning network that, unlike its shallow correlates, it is able to retain a state that can represent information from an arbitrarily long context window. The experimental results showed that the proposed architecture achieved superior performance when compared to Hidden Markov Model in tests carried out on the same databases. |
publishDate |
2017 |
dc.date.issued.fl_str_mv |
2017-07-26 |
dc.date.accessioned.fl_str_mv |
2019-03-25T23:09:10Z |
dc.date.available.fl_str_mv |
2019-03-25T23:09:10Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
SANTANA, Luciana Maiara Queiroz de. Aplicação de redes neurais recorrentes no reconhecimento automático da fala em ambientes com ruídos. 2017. 68 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Sergipe, São Cristóvão, SE, 2017. |
dc.identifier.uri.fl_str_mv |
http://ri.ufs.br/jspui/handle/riufs/10760 |
identifier_str_mv |
SANTANA, Luciana Maiara Queiroz de. Aplicação de redes neurais recorrentes no reconhecimento automático da fala em ambientes com ruídos. 2017. 68 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Sergipe, São Cristóvão, SE, 2017. |
url |
http://ri.ufs.br/jspui/handle/riufs/10760 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.program.fl_str_mv |
Pós-Graduação em Ciência da Computação |
dc.publisher.initials.fl_str_mv |
UFS |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFS instname:Universidade Federal de Sergipe (UFS) instacron:UFS |
instname_str |
Universidade Federal de Sergipe (UFS) |
instacron_str |
UFS |
institution |
UFS |
reponame_str |
Repositório Institucional da UFS |
collection |
Repositório Institucional da UFS |
bitstream.url.fl_str_mv |
https://ri.ufs.br/jspui/bitstream/riufs/10760/3/LUCIANA_MAIARA_QUEIROZ_SANTANA.pdf.txt https://ri.ufs.br/jspui/bitstream/riufs/10760/4/LUCIANA_MAIARA_QUEIROZ_SANTANA.pdf.jpg https://ri.ufs.br/jspui/bitstream/riufs/10760/1/license.txt https://ri.ufs.br/jspui/bitstream/riufs/10760/2/LUCIANA_MAIARA_QUEIROZ_SANTANA.pdf |
bitstream.checksum.fl_str_mv |
42764e8439ee008ef78c7f7aff0c792b c576da86d49d9fe2800043d11b639ce3 098cbbf65c2c15e1fb2e49c5d306a44c 1025158244aab1d7bb685026a2cd26cd |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFS - Universidade Federal de Sergipe (UFS) |
repository.mail.fl_str_mv |
repositorio@academico.ufs.br |
_version_ |
1802110816662585344 |