Reconhecimento de voz para comandos de direcionamento por meio de redes neurais

Detalhes bibliográficos
Autor(a) principal: Valiati, Joao Francisco
Data de Publicação: 2000
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da UFRGS
Texto Completo: http://hdl.handle.net/10183/2947
Resumo: Este trabalho relata o desenvolvimento de uma aplicação capaz de reconhecer um vocabulário restrito de comandos de direcionamento pronunciados de forma isolada e independentes do locutor. Os métodos utilizados para efetivar o reconhecimento foram: técnicas clássicas de processamento de sinais e redes neurais artificiais. No processamento de sinais visou-se o pré-processamento das amostras para obtenção dos coeficientes cepstrais. Enquanto que para o treinamento e classificação foram utilizadas duas redes neurais distintas, as redes: Backpropagation e Fuzzy ARTMAP. Diversas amostras foram coletadas de diferentes usuários no sentido de compor um banco de dados flexível para o aprendizado das redes neurais, que garantisse uma representação satisfatória da grande variabilidade que apresentam as pronúncias entre as vozes dos usuários. Com a aplicação de tais técnicas, o reconhecimento demostrou-se eficaz, distinguindo cada um dos comandos com bons índices de acerto, uma vez que o sistema é independente do locutor.
id URGS_28b1530a6d99540ee092c8815f6908af
oai_identifier_str oai:www.lume.ufrgs.br:10183/2947
network_acronym_str URGS
network_name_str Biblioteca Digital de Teses e Dissertações da UFRGS
repository_id_str 1853
spelling Valiati, Joao FranciscoEngel, Paulo Martins2007-06-06T17:25:09Z2000http://hdl.handle.net/10183/2947000284261Este trabalho relata o desenvolvimento de uma aplicação capaz de reconhecer um vocabulário restrito de comandos de direcionamento pronunciados de forma isolada e independentes do locutor. Os métodos utilizados para efetivar o reconhecimento foram: técnicas clássicas de processamento de sinais e redes neurais artificiais. No processamento de sinais visou-se o pré-processamento das amostras para obtenção dos coeficientes cepstrais. Enquanto que para o treinamento e classificação foram utilizadas duas redes neurais distintas, as redes: Backpropagation e Fuzzy ARTMAP. Diversas amostras foram coletadas de diferentes usuários no sentido de compor um banco de dados flexível para o aprendizado das redes neurais, que garantisse uma representação satisfatória da grande variabilidade que apresentam as pronúncias entre as vozes dos usuários. Com a aplicação de tais técnicas, o reconhecimento demostrou-se eficaz, distinguindo cada um dos comandos com bons índices de acerto, uma vez que o sistema é independente do locutor.application/pdfporReconhecimento : PadroesProcessamento : SinaisProcessamento : VozReconhecimento : FalaRedes neuraisReconhecimento de voz para comandos de direcionamento por meio de redes neuraisinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPrograma de Pós-Graduação em ComputaçãoPorto Alegre, BR-RS2000mestradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSORIGINAL000284261.pdf000284261.pdfTexto completoapplication/pdf902984http://www.lume.ufrgs.br/bitstream/10183/2947/1/000284261.pdf37b34edf373eaae320cf4e4777217e1fMD51TEXT000284261.pdf.txt000284261.pdf.txtExtracted Texttext/plain260241http://www.lume.ufrgs.br/bitstream/10183/2947/2/000284261.pdf.txtbae537a9b8b64a99ac0c8a26a28d1f80MD52THUMBNAIL000284261.pdf.jpg000284261.pdf.jpgGenerated Thumbnailimage/jpeg1066http://www.lume.ufrgs.br/bitstream/10183/2947/3/000284261.pdf.jpgc5df6c87838fec463082463d96d1f1f6MD5310183/29472018-10-15 09:00:26.494oai:www.lume.ufrgs.br:10183/2947Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532018-10-15T12:00:26Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Reconhecimento de voz para comandos de direcionamento por meio de redes neurais
title Reconhecimento de voz para comandos de direcionamento por meio de redes neurais
spellingShingle Reconhecimento de voz para comandos de direcionamento por meio de redes neurais
Valiati, Joao Francisco
Reconhecimento : Padroes
Processamento : Sinais
Processamento : Voz
Reconhecimento : Fala
Redes neurais
title_short Reconhecimento de voz para comandos de direcionamento por meio de redes neurais
title_full Reconhecimento de voz para comandos de direcionamento por meio de redes neurais
title_fullStr Reconhecimento de voz para comandos de direcionamento por meio de redes neurais
title_full_unstemmed Reconhecimento de voz para comandos de direcionamento por meio de redes neurais
title_sort Reconhecimento de voz para comandos de direcionamento por meio de redes neurais
author Valiati, Joao Francisco
author_facet Valiati, Joao Francisco
author_role author
dc.contributor.author.fl_str_mv Valiati, Joao Francisco
dc.contributor.advisor1.fl_str_mv Engel, Paulo Martins
contributor_str_mv Engel, Paulo Martins
dc.subject.por.fl_str_mv Reconhecimento : Padroes
Processamento : Sinais
Processamento : Voz
Reconhecimento : Fala
Redes neurais
topic Reconhecimento : Padroes
Processamento : Sinais
Processamento : Voz
Reconhecimento : Fala
Redes neurais
description Este trabalho relata o desenvolvimento de uma aplicação capaz de reconhecer um vocabulário restrito de comandos de direcionamento pronunciados de forma isolada e independentes do locutor. Os métodos utilizados para efetivar o reconhecimento foram: técnicas clássicas de processamento de sinais e redes neurais artificiais. No processamento de sinais visou-se o pré-processamento das amostras para obtenção dos coeficientes cepstrais. Enquanto que para o treinamento e classificação foram utilizadas duas redes neurais distintas, as redes: Backpropagation e Fuzzy ARTMAP. Diversas amostras foram coletadas de diferentes usuários no sentido de compor um banco de dados flexível para o aprendizado das redes neurais, que garantisse uma representação satisfatória da grande variabilidade que apresentam as pronúncias entre as vozes dos usuários. Com a aplicação de tais técnicas, o reconhecimento demostrou-se eficaz, distinguindo cada um dos comandos com bons índices de acerto, uma vez que o sistema é independente do locutor.
publishDate 2000
dc.date.issued.fl_str_mv 2000
dc.date.accessioned.fl_str_mv 2007-06-06T17:25:09Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/2947
dc.identifier.nrb.pt_BR.fl_str_mv 000284261
url http://hdl.handle.net/10183/2947
identifier_str_mv 000284261
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Biblioteca Digital de Teses e Dissertações da UFRGS
collection Biblioteca Digital de Teses e Dissertações da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/2947/1/000284261.pdf
http://www.lume.ufrgs.br/bitstream/10183/2947/2/000284261.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/2947/3/000284261.pdf.jpg
bitstream.checksum.fl_str_mv 37b34edf373eaae320cf4e4777217e1f
bae537a9b8b64a99ac0c8a26a28d1f80
c5df6c87838fec463082463d96d1f1f6
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv lume@ufrgs.br||lume@ufrgs.br
_version_ 1810085022459232256