Redução de ruído sonoro aplicada ao reconhecimento automático de voz.

LIMA, Ísis de Andrade.

Redução de ruído sonoro aplicada ao reconhecimento automático de voz.

Detalhes bibliográficos
Autor(a) principal:	LIMA, Ísis de Andrade.
Data de Publicação:	2014
Tipo de documento:	Dissertação
Idioma:	por
Título da fonte:	Biblioteca Digital de Teses e Dissertações da UFCG
Texto Completo:	http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/8156
Resumo:	Um dos principais problemas no desenvolvimento de filtros para sinais de voz é a avaliação do seu desempenho. Não é possível determinar o desempenho de uma técnica de tratamento de ruído sonoro apenas pela análise da SNR obtida, pois a qualidade do sinal filtrado está ligada à sua inteligibilidade. As avaliações subjetivas também não são conclusivas. Esta dissertação apresenta uma avaliação comparativa dos filtros com resposta finita ao impulso de Wiener ótimo e sub-ótimo, que permite a ponderação entre redução de ruído obtida e distorção inserida a partir do ajuste de um parâmetro , por meio da observação da taxa de acertos de um sistema de reconhecimento automático de voz (RAV). Os filtros implementados possuem ordem 20 e janela de análise de 20 ms (intervalo no qual o sinal de voz pode ser considerado estacionário). Para o filtro sub-ótimo foram usados = 0; 5, = 0; 7 e = 0; 8. Para o reconhecedor foi utilizado o decodificador de amplo vocabulário Julius, modelo acústico baseado em cadeias de Markov (Hidden Markov Models – HMMs) e modelo linguístico N-grama para o português brasileiro. Os testes foram realizados com 20 frases de locutores distintos, totalizando 146 palavras. Foram obtidos os percentuais de palavras reconhecidas corretamente para os sinais sem adição de ruído, e para ruído aditivo gaussiano branco com SNR de 20 dB, 15 dB, 10 dB, 5 dB, 3 dB e 0 dB. Para avaliar o efeito de distorção nos filtros implementados, os sinais obtidos pela filtragem dos arquivos de voz sem ruído são processados pelo reconhecedor, observando que a percentagem de acerto aumenta com a diminuição do parâmetro (o filtro de Wiener corresponde a = 1). A partir da análise dos resultados de reconhecimento para os diferentes valores de SNR se conclui que a aplicação do filtro sub-ótimo com = 0; 7 resulta na melhor taxa de acertos para o reconhecedor utilizado dentre os quatro filtros desenvolvidos quando o ruído é aditivo gaussiano branco. A melhoria observada foi de 10% para a menor SNR avaliada e de 14% para a maior SNR avaliada.

Metadados do item

id	UFCG_f54ccff2fc268bd766c819f5151ec8f5
oai_identifier_str	oai:localhost:riufcg/8156
network_acronym_str	UFCG
network_name_str	Biblioteca Digital de Teses e Dissertações da UFCG
repository_id_str	4851
spelling	Redução de ruído sonoro aplicada ao reconhecimento automático de voz.Noise reduction applied automatic voice recognition.Processamento Digital de SinaisRedução de RuídoReconhecimento de VozAvaliação Comparativa dos FiltrosImpulso de Wiener Ótimo e Sub-ÓtimoSistema de Reconhecimento Automático de Voz (RAV)Cadeias de Markov - Modelo AcústicoModelo Linguístico N-GramaRuído Aditivo Gaussiano BrancoHidden Markov Models (HMMs)Digital Signal ProcessingNoise ReductionVoice RecognitionComparative Evaluation of FiltersWiener Impulse Great and Sub-GreatAutomatic Voice Recognition System (RAV)Markov Chains - Acoustic ModelLanguage Model N-GramWhite Gaussian Additive NoiseEngenharia Elétrica.Um dos principais problemas no desenvolvimento de filtros para sinais de voz é a avaliação do seu desempenho. Não é possível determinar o desempenho de uma técnica de tratamento de ruído sonoro apenas pela análise da SNR obtida, pois a qualidade do sinal filtrado está ligada à sua inteligibilidade. As avaliações subjetivas também não são conclusivas. Esta dissertação apresenta uma avaliação comparativa dos filtros com resposta finita ao impulso de Wiener ótimo e sub-ótimo, que permite a ponderação entre redução de ruído obtida e distorção inserida a partir do ajuste de um parâmetro , por meio da observação da taxa de acertos de um sistema de reconhecimento automático de voz (RAV). Os filtros implementados possuem ordem 20 e janela de análise de 20 ms (intervalo no qual o sinal de voz pode ser considerado estacionário). Para o filtro sub-ótimo foram usados = 0; 5, = 0; 7 e = 0; 8. Para o reconhecedor foi utilizado o decodificador de amplo vocabulário Julius, modelo acústico baseado em cadeias de Markov (Hidden Markov Models – HMMs) e modelo linguístico N-grama para o português brasileiro. Os testes foram realizados com 20 frases de locutores distintos, totalizando 146 palavras. Foram obtidos os percentuais de palavras reconhecidas corretamente para os sinais sem adição de ruído, e para ruído aditivo gaussiano branco com SNR de 20 dB, 15 dB, 10 dB, 5 dB, 3 dB e 0 dB. Para avaliar o efeito de distorção nos filtros implementados, os sinais obtidos pela filtragem dos arquivos de voz sem ruído são processados pelo reconhecedor, observando que a percentagem de acerto aumenta com a diminuição do parâmetro (o filtro de Wiener corresponde a = 1). A partir da análise dos resultados de reconhecimento para os diferentes valores de SNR se conclui que a aplicação do filtro sub-ótimo com = 0; 7 resulta na melhor taxa de acertos para o reconhecedor utilizado dentre os quatro filtros desenvolvidos quando o ruído é aditivo gaussiano branco. A melhoria observada foi de 10% para a menor SNR avaliada e de 14% para a maior SNR avaliada.One of the main problems in the development of filters for speech signals is performance evaluation. It is not possible to evaluate the technique only by the obtained SNR analysis, because the quality of the filtered signal is related to its intelligibility. Subjective evaluations are also not conclusive. This dissertation presents a comparative evaluation of finite impulse response Wiener optimal and sub-optimal filters, which allows weighting between noise reduction and distortion insertion by setting a parameter , through the observation of an automatic speech recognition (ASR) system error rate. The 20 order filters were implemented with analysis window of 20 ms (for which the speech signal can be considered stationary). A sub-optimal filter was tested, for = 0:5, alpha = 0:7 and = 0:8. The large vocabulary decoder Julius was chosen for the ASR system. Hidden Markov Models (HMMs) and N-gram language model for Brazilian Portuguese were used for acoustic and linguistic training. The tests were performed with 20 sentences from different speakers, totaling 146 words. The percentage of correctly recognized words for the clean speech signals, additive white Gaussian noise (AWGN) was obtained, for a SNR of 20 dB, 15 dB, 10 dB, 5 dB, 3 dB, 0 dB, and filtered signals. To evaluate the distortion effect caused by filtering, the filtered version of clean speech signals were processed by the recognizer, and it was observed that the error rate decreases with the reduction of the parameter (the Wiener filter corresponds to = 1). Based on the analysis of recognition results for different values of SNR, the application of sub-optimal filter, with = 0:7, produces the best recognition rate for a specified AWGN among the four designed filters. The observed improvement was 10% for the lowest SNR and 14% for the highest SNR evaluated.Universidade Federal de Campina GrandeBrasilCentro de Engenharia Elétrica e Informática - CEEIPÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICAUFCGALENCAR, Marcelo Sampaio de.ALENCAR, M.S.http://lattes.cnpq.br/0946722048975388VELOSO, Luciana Ribeiro.LOPES, Waslon Terllizzie Araújo.QUEIROZ, Wamberto José Lira de.LIMA, Ísis de Andrade.2014-03-282019-10-16T20:01:46Z2019-10-162019-10-16T20:01:46Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttp://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/8156LIMA, I.de A. Redução de ruído sonoro aplicada ao reconhecimento automático de voz. 2014. 103 f. (Dissertação de Mestrado em Engenharia Elétrica), Programa de Pós-Graduação em Engenharia Elétrica, Centro de Engenharia Elétrica e Informática , Universidade Federal de Campina Grande – Paraíba Brasil, 2014.porinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFCGinstname:Universidade Federal de Campina Grande (UFCG)instacron:UFCG2021-06-15T18:25:24Zoai:localhost:riufcg/8156Biblioteca Digital de Teses e Dissertaçõeshttp://bdtd.ufcg.edu.br/PUBhttp://dspace.sti.ufcg.edu.br:8080/oai/requestbdtd@setor.ufcg.edu.br \|\| bdtd@setor.ufcg.edu.bropendoar:48512021-06-15T18:25:24Biblioteca Digital de Teses e Dissertações da UFCG - Universidade Federal de Campina Grande (UFCG)false
dc.title.none.fl_str_mv	Redução de ruído sonoro aplicada ao reconhecimento automático de voz. Noise reduction applied automatic voice recognition.
title	Redução de ruído sonoro aplicada ao reconhecimento automático de voz.
spellingShingle	Redução de ruído sonoro aplicada ao reconhecimento automático de voz. LIMA, Ísis de Andrade. Processamento Digital de Sinais Redução de Ruído Reconhecimento de Voz Avaliação Comparativa dos Filtros Impulso de Wiener Ótimo e Sub-Ótimo Sistema de Reconhecimento Automático de Voz (RAV) Cadeias de Markov - Modelo Acústico Modelo Linguístico N-Grama Ruído Aditivo Gaussiano Branco Hidden Markov Models (HMMs) Digital Signal Processing Noise Reduction Voice Recognition Comparative Evaluation of Filters Wiener Impulse Great and Sub-Great Automatic Voice Recognition System (RAV) Markov Chains - Acoustic Model Language Model N-Gram White Gaussian Additive Noise Engenharia Elétrica.
title_short	Redução de ruído sonoro aplicada ao reconhecimento automático de voz.
title_full	Redução de ruído sonoro aplicada ao reconhecimento automático de voz.
title_fullStr	Redução de ruído sonoro aplicada ao reconhecimento automático de voz.
title_full_unstemmed	Redução de ruído sonoro aplicada ao reconhecimento automático de voz.
title_sort	Redução de ruído sonoro aplicada ao reconhecimento automático de voz.
author	LIMA, Ísis de Andrade.
author_facet	LIMA, Ísis de Andrade.
author_role	author
dc.contributor.none.fl_str_mv	ALENCAR, Marcelo Sampaio de. ALENCAR, M.S. http://lattes.cnpq.br/0946722048975388 VELOSO, Luciana Ribeiro. LOPES, Waslon Terllizzie Araújo. QUEIROZ, Wamberto José Lira de.
dc.contributor.author.fl_str_mv	LIMA, Ísis de Andrade.
dc.subject.por.fl_str_mv	Processamento Digital de Sinais Redução de Ruído Reconhecimento de Voz Avaliação Comparativa dos Filtros Impulso de Wiener Ótimo e Sub-Ótimo Sistema de Reconhecimento Automático de Voz (RAV) Cadeias de Markov - Modelo Acústico Modelo Linguístico N-Grama Ruído Aditivo Gaussiano Branco Hidden Markov Models (HMMs) Digital Signal Processing Noise Reduction Voice Recognition Comparative Evaluation of Filters Wiener Impulse Great and Sub-Great Automatic Voice Recognition System (RAV) Markov Chains - Acoustic Model Language Model N-Gram White Gaussian Additive Noise Engenharia Elétrica.
topic	Processamento Digital de Sinais Redução de Ruído Reconhecimento de Voz Avaliação Comparativa dos Filtros Impulso de Wiener Ótimo e Sub-Ótimo Sistema de Reconhecimento Automático de Voz (RAV) Cadeias de Markov - Modelo Acústico Modelo Linguístico N-Grama Ruído Aditivo Gaussiano Branco Hidden Markov Models (HMMs) Digital Signal Processing Noise Reduction Voice Recognition Comparative Evaluation of Filters Wiener Impulse Great and Sub-Great Automatic Voice Recognition System (RAV) Markov Chains - Acoustic Model Language Model N-Gram White Gaussian Additive Noise Engenharia Elétrica.
description	Um dos principais problemas no desenvolvimento de filtros para sinais de voz é a avaliação do seu desempenho. Não é possível determinar o desempenho de uma técnica de tratamento de ruído sonoro apenas pela análise da SNR obtida, pois a qualidade do sinal filtrado está ligada à sua inteligibilidade. As avaliações subjetivas também não são conclusivas. Esta dissertação apresenta uma avaliação comparativa dos filtros com resposta finita ao impulso de Wiener ótimo e sub-ótimo, que permite a ponderação entre redução de ruído obtida e distorção inserida a partir do ajuste de um parâmetro , por meio da observação da taxa de acertos de um sistema de reconhecimento automático de voz (RAV). Os filtros implementados possuem ordem 20 e janela de análise de 20 ms (intervalo no qual o sinal de voz pode ser considerado estacionário). Para o filtro sub-ótimo foram usados = 0; 5, = 0; 7 e = 0; 8. Para o reconhecedor foi utilizado o decodificador de amplo vocabulário Julius, modelo acústico baseado em cadeias de Markov (Hidden Markov Models – HMMs) e modelo linguístico N-grama para o português brasileiro. Os testes foram realizados com 20 frases de locutores distintos, totalizando 146 palavras. Foram obtidos os percentuais de palavras reconhecidas corretamente para os sinais sem adição de ruído, e para ruído aditivo gaussiano branco com SNR de 20 dB, 15 dB, 10 dB, 5 dB, 3 dB e 0 dB. Para avaliar o efeito de distorção nos filtros implementados, os sinais obtidos pela filtragem dos arquivos de voz sem ruído são processados pelo reconhecedor, observando que a percentagem de acerto aumenta com a diminuição do parâmetro (o filtro de Wiener corresponde a = 1). A partir da análise dos resultados de reconhecimento para os diferentes valores de SNR se conclui que a aplicação do filtro sub-ótimo com = 0; 7 resulta na melhor taxa de acertos para o reconhecedor utilizado dentre os quatro filtros desenvolvidos quando o ruído é aditivo gaussiano branco. A melhoria observada foi de 10% para a menor SNR avaliada e de 14% para a maior SNR avaliada.
publishDate	2014
dc.date.none.fl_str_mv	2014-03-28 2019-10-16T20:01:46Z 2019-10-16 2019-10-16T20:01:46Z
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/8156 LIMA, I.de A. Redução de ruído sonoro aplicada ao reconhecimento automático de voz. 2014. 103 f. (Dissertação de Mestrado em Engenharia Elétrica), Programa de Pós-Graduação em Engenharia Elétrica, Centro de Engenharia Elétrica e Informática , Universidade Federal de Campina Grande – Paraíba Brasil, 2014.
url	http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/8156
identifier_str_mv	LIMA, I.de A. Redução de ruído sonoro aplicada ao reconhecimento automático de voz. 2014. 103 f. (Dissertação de Mestrado em Engenharia Elétrica), Programa de Pós-Graduação em Engenharia Elétrica, Centro de Engenharia Elétrica e Informática , Universidade Federal de Campina Grande – Paraíba Brasil, 2014.
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.publisher.none.fl_str_mv	Universidade Federal de Campina Grande Brasil Centro de Engenharia Elétrica e Informática - CEEI PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA UFCG
publisher.none.fl_str_mv	Universidade Federal de Campina Grande Brasil Centro de Engenharia Elétrica e Informática - CEEI PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA UFCG
dc.source.none.fl_str_mv	reponame:Biblioteca Digital de Teses e Dissertações da UFCG instname:Universidade Federal de Campina Grande (UFCG) instacron:UFCG
instname_str	Universidade Federal de Campina Grande (UFCG)
instacron_str	UFCG
institution	UFCG
reponame_str	Biblioteca Digital de Teses e Dissertações da UFCG
collection	Biblioteca Digital de Teses e Dissertações da UFCG
repository.name.fl_str_mv	Biblioteca Digital de Teses e Dissertações da UFCG - Universidade Federal de Campina Grande (UFCG)
repository.mail.fl_str_mv	bdtd@setor.ufcg.edu.br \|\| bdtd@setor.ufcg.edu.br
_version_	1809744404174340096

Redução de ruído sonoro aplicada ao reconhecimento automático de voz.

Registros relacionados