Reconhecimento automático de voz para palavras isoladas e independente do locutor
Autor(a) principal: | |
---|---|
Data de Publicação: | 1994 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da UFRGS |
Texto Completo: | http://hdl.handle.net/10183/189690 |
Resumo: | Neste trabalho são apresentadas diversas técnicas aplicadas no reconhecimento de voz para palavras isoladas e independente do locutor. Estas técnicas são estudadas abordando os aspectos referentes a sua aplicabilidade prática. É apresentada a implementação de um sistema de reconhecimento de voz em tempo real. São estudadas as características do processo de produção da voz e da capacidade auditiva do homem. São abordadas as limitações relacionadas com o reconhecimento automática da voz e apresentada a estrutura de um reconhecedor de voz para palavras isoladas.Diversas formas de representação do sinal de voz utilizando medidas de energta, cruzamento por zero, análise espectral e análise cepstral são apresentadas e estudadas de modo a serem utilizadas no processo de reconhecimento de voz. A técnica LPC de codificação do sinal de voz é analisada com a descrição dos algoritmos de extração dos parâmetros do sinal. Também são estudadas medidas de distorção entre parâmetros do sinal de voz para a avaliar as diferenças entre eles. É apresentado o processo de quantização vetorial que reduz o volume de dados utilizado no processo de reconhecimento.Duas técnicas de reconhecimento de voz (DTW e H1v1M) são estudadas e detalhados os aspectos referentes à implementação prática de tais algoritmos. Também são apresentados algoritmos de detecção automática dos limites da palavra. Os detalhes da implementação em tempo real com os resultados de diversos experimentos práticos são mostrados. Conclusões gerais e a avaliação dos resultados obtidos são apresentados. Também são relacionados alguns aspectos para a melhoria e desenvolvimento do sistema de reconhecimento descrito neste trabalho. |
id |
URGS_8de2961f06a8a6a09ef4448036d9897a |
---|---|
oai_identifier_str |
oai:www.lume.ufrgs.br:10183/189690 |
network_acronym_str |
URGS |
network_name_str |
Biblioteca Digital de Teses e Dissertações da UFRGS |
repository_id_str |
1853 |
spelling |
Luft, Joel AugustoSusin, Altamiro Amadeu2019-03-28T04:10:00Z1994http://hdl.handle.net/10183/189690000141964Neste trabalho são apresentadas diversas técnicas aplicadas no reconhecimento de voz para palavras isoladas e independente do locutor. Estas técnicas são estudadas abordando os aspectos referentes a sua aplicabilidade prática. É apresentada a implementação de um sistema de reconhecimento de voz em tempo real. São estudadas as características do processo de produção da voz e da capacidade auditiva do homem. São abordadas as limitações relacionadas com o reconhecimento automática da voz e apresentada a estrutura de um reconhecedor de voz para palavras isoladas.Diversas formas de representação do sinal de voz utilizando medidas de energta, cruzamento por zero, análise espectral e análise cepstral são apresentadas e estudadas de modo a serem utilizadas no processo de reconhecimento de voz. A técnica LPC de codificação do sinal de voz é analisada com a descrição dos algoritmos de extração dos parâmetros do sinal. Também são estudadas medidas de distorção entre parâmetros do sinal de voz para a avaliar as diferenças entre eles. É apresentado o processo de quantização vetorial que reduz o volume de dados utilizado no processo de reconhecimento.Duas técnicas de reconhecimento de voz (DTW e H1v1M) são estudadas e detalhados os aspectos referentes à implementação prática de tais algoritmos. Também são apresentados algoritmos de detecção automática dos limites da palavra. Os detalhes da implementação em tempo real com os resultados de diversos experimentos práticos são mostrados. Conclusões gerais e a avaliação dos resultados obtidos são apresentados. Também são relacionados alguns aspectos para a melhoria e desenvolvimento do sistema de reconhecimento descrito neste trabalho.application/pdfporVoz computacionalProcessamento de sinais de vozInstrumentação eletro-eletrônicaReconhecimento automático de voz para palavras isoladas e independente do locutorinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulEscola de EngenhariaPrograma de Pós-Graduação em Engenharia Metalúrgica e dos MateriaisPorto Alegre,br-RS1994mestradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT000141964.pdf.txt000141964.pdf.txtExtracted Texttext/plain179034http://www.lume.ufrgs.br/bitstream/10183/189690/2/000141964.pdf.txta4f236cb2d89e57c7c0883a49c49eb0aMD52ORIGINAL000141964.pdfTexto completoapplication/pdf14807212http://www.lume.ufrgs.br/bitstream/10183/189690/1/000141964.pdf5b0aca1ac87171b86ba42a27aa3ddd10MD5110183/1896902019-03-29 04:11:47.491964oai:www.lume.ufrgs.br:10183/189690Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532019-03-29T07:11:47Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false |
dc.title.pt_BR.fl_str_mv |
Reconhecimento automático de voz para palavras isoladas e independente do locutor |
title |
Reconhecimento automático de voz para palavras isoladas e independente do locutor |
spellingShingle |
Reconhecimento automático de voz para palavras isoladas e independente do locutor Luft, Joel Augusto Voz computacional Processamento de sinais de voz Instrumentação eletro-eletrônica |
title_short |
Reconhecimento automático de voz para palavras isoladas e independente do locutor |
title_full |
Reconhecimento automático de voz para palavras isoladas e independente do locutor |
title_fullStr |
Reconhecimento automático de voz para palavras isoladas e independente do locutor |
title_full_unstemmed |
Reconhecimento automático de voz para palavras isoladas e independente do locutor |
title_sort |
Reconhecimento automático de voz para palavras isoladas e independente do locutor |
author |
Luft, Joel Augusto |
author_facet |
Luft, Joel Augusto |
author_role |
author |
dc.contributor.author.fl_str_mv |
Luft, Joel Augusto |
dc.contributor.advisor1.fl_str_mv |
Susin, Altamiro Amadeu |
contributor_str_mv |
Susin, Altamiro Amadeu |
dc.subject.por.fl_str_mv |
Voz computacional Processamento de sinais de voz Instrumentação eletro-eletrônica |
topic |
Voz computacional Processamento de sinais de voz Instrumentação eletro-eletrônica |
description |
Neste trabalho são apresentadas diversas técnicas aplicadas no reconhecimento de voz para palavras isoladas e independente do locutor. Estas técnicas são estudadas abordando os aspectos referentes a sua aplicabilidade prática. É apresentada a implementação de um sistema de reconhecimento de voz em tempo real. São estudadas as características do processo de produção da voz e da capacidade auditiva do homem. São abordadas as limitações relacionadas com o reconhecimento automática da voz e apresentada a estrutura de um reconhecedor de voz para palavras isoladas.Diversas formas de representação do sinal de voz utilizando medidas de energta, cruzamento por zero, análise espectral e análise cepstral são apresentadas e estudadas de modo a serem utilizadas no processo de reconhecimento de voz. A técnica LPC de codificação do sinal de voz é analisada com a descrição dos algoritmos de extração dos parâmetros do sinal. Também são estudadas medidas de distorção entre parâmetros do sinal de voz para a avaliar as diferenças entre eles. É apresentado o processo de quantização vetorial que reduz o volume de dados utilizado no processo de reconhecimento.Duas técnicas de reconhecimento de voz (DTW e H1v1M) são estudadas e detalhados os aspectos referentes à implementação prática de tais algoritmos. Também são apresentados algoritmos de detecção automática dos limites da palavra. Os detalhes da implementação em tempo real com os resultados de diversos experimentos práticos são mostrados. Conclusões gerais e a avaliação dos resultados obtidos são apresentados. Também são relacionados alguns aspectos para a melhoria e desenvolvimento do sistema de reconhecimento descrito neste trabalho. |
publishDate |
1994 |
dc.date.issued.fl_str_mv |
1994 |
dc.date.accessioned.fl_str_mv |
2019-03-28T04:10:00Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10183/189690 |
dc.identifier.nrb.pt_BR.fl_str_mv |
000141964 |
url |
http://hdl.handle.net/10183/189690 |
identifier_str_mv |
000141964 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UFRGS instname:Universidade Federal do Rio Grande do Sul (UFRGS) instacron:UFRGS |
instname_str |
Universidade Federal do Rio Grande do Sul (UFRGS) |
instacron_str |
UFRGS |
institution |
UFRGS |
reponame_str |
Biblioteca Digital de Teses e Dissertações da UFRGS |
collection |
Biblioteca Digital de Teses e Dissertações da UFRGS |
bitstream.url.fl_str_mv |
http://www.lume.ufrgs.br/bitstream/10183/189690/2/000141964.pdf.txt http://www.lume.ufrgs.br/bitstream/10183/189690/1/000141964.pdf |
bitstream.checksum.fl_str_mv |
a4f236cb2d89e57c7c0883a49c49eb0a 5b0aca1ac87171b86ba42a27aa3ddd10 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS) |
repository.mail.fl_str_mv |
lume@ufrgs.br||lume@ufrgs.br |
_version_ |
1810085472332939264 |