Conversão grafema-fone para um sistema de reconhecimento de voz com suporte a grandes vocabulários para o português brasileiro

Detalhes bibliográficos
Autor(a) principal: HOSN, Chadia Nadim Aboul
Data de Publicação: 2006
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFPA
Texto Completo: http://www.repositorio.ufpa.br:8080/jspui/handle/2011/1648
Resumo: Speech processing has become a data-driven technology. Hence, the success of research in this area is linked to the existence of public corpora and associated resources, as a phonetic dictionary. In contrast to other languages such as English, one cannot find, in public domain, a Large Vocabulary Continuos Speech Recognition (LVCSR) System for Brazilian Portuguese. This work discusses some efforts within the FalaBrasil initiative [1], developed by researchers, teachers and students of the Signal Processing Laboratory (LaPS) at UFPA, providing an overview of the research and softwares related to Automatic Speech Recognition (ASR) for Brazilian Portuguese. More specifically, the present work discusses the implementation of a large vocabulary ASR for Brazilian Portuguese using the HTK software, which is based on hidden Markov models (HMM). Besides, the work discusses the implementation of a grapheme-phoneme conversion module using machine learning techniques.
id UFPA_b89eef3190b9ee1c5350ec9b0cd6963a
oai_identifier_str oai:repositorio.ufpa.br:2011/1648
network_acronym_str UFPA
network_name_str Repositório Institucional da UFPA
repository_id_str 2123
spelling 2011-03-23T21:19:13Z2011-03-23T21:19:13Z2006-06-12HOSN, Chadia Nadim Aboul. Conversão grafema-fone para um sistema de reconhecimento de voz com suporte a grandes vocabulários para o português brasileiro. 2006. 77 f. Dissertação (Mestrado) - Universidade Federal do Pará, Instituto de Tecnologia, Belém, 2006. Programa de Pós-Graduação em Engenharia Elétrica.http://www.repositorio.ufpa.br:8080/jspui/handle/2011/1648Speech processing has become a data-driven technology. Hence, the success of research in this area is linked to the existence of public corpora and associated resources, as a phonetic dictionary. In contrast to other languages such as English, one cannot find, in public domain, a Large Vocabulary Continuos Speech Recognition (LVCSR) System for Brazilian Portuguese. This work discusses some efforts within the FalaBrasil initiative [1], developed by researchers, teachers and students of the Signal Processing Laboratory (LaPS) at UFPA, providing an overview of the research and softwares related to Automatic Speech Recognition (ASR) for Brazilian Portuguese. More specifically, the present work discusses the implementation of a large vocabulary ASR for Brazilian Portuguese using the HTK software, which is based on hidden Markov models (HMM). Besides, the work discusses the implementation of a grapheme-phoneme conversion module using machine learning techniques.O processamento de voz tornou-se uma tecnologia cada vez mais baseada na modelagem automática de vasta quantidade de dados. Desta forma, o sucesso das pesquisas nesta área está diretamente ligado a existência de corpora de domínio público e outros recursos específicos, tal como um dicionário fonético. No Brasil, ao contrário do que acontece para a língua inglesa, por exemplo, não existe atualmente em domínio público um sistema de Reconhecimento Automático de Voz (RAV) para o Português Brasileiro com suporte a grandes vocabulários. Frente a este cenário, o trabalho tem como principal objetivo discutir esforços dentro da iniciativa FalaBrasil [1], criada pelo Laboratório de Processamento de Sinais (LaPS) da UFPA, apresentando pesquisas e softwares na área de RAV para o Português do Brasil. Mais especificamente, o presente trabalho discute a implementação de um sistema de reconhecimento de voz com suporte a grandes vocabulários para o Português do Brasil, utilizando a ferramenta HTK baseada em modelo oculto de Markov (HMM) e a criação de um módulo de conversão grafema-fone, utilizando técnicas de aprendizado de máquina.porUniversidade Federal do ParáPrograma de Pós-Graduação em Engenharia ElétricaUFPABrasilInstituto de TecnologiaCNPQ::ENGENHARIAS::ENGENHARIA ELETRICA::TELECOMUNICACOES::SISTEMAS DE TELECOMUNICACOESSistema de processamento de vozProcessamento de linguagem natural (Computação)Ensino por computadorLíngua portuguesaConversão grafema-fone para um sistema de reconhecimento de voz com suporte a grandes vocabulários para o português brasileiroConversion grapheme-phone for a system of recognition of voice with support the great vocabularies for the Brazilian Portugueseinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisKLAUTAU JÚNIOR, Aldebaro Barreto da Rochahttp://lattes.cnpq.br/1596629769697284http://lattes.cnpq.br/2478157567318435HOSN, Chadia Nadim Aboulinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFPAinstname:Universidade Federal do Pará (UFPA)instacron:UFPAORIGINALDissertacao_ConversaoGrafemaFone.pdfDissertacao_ConversaoGrafemaFone.pdfapplication/pdf1673670http://repositorio.ufpa.br/oai/bitstream/2011/1648/4/Dissertacao_ConversaoGrafemaFone.pdf0edf59aee701ca9d66f85027806ac9b6MD54CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-823930http://repositorio.ufpa.br/oai/bitstream/2011/1648/5/license_rdf6b71892b27c4389434057b8b0e86b43eMD55license_textlicense_texttext/html; charset=utf-823738http://repositorio.ufpa.br/oai/bitstream/2011/1648/6/license_text1a64b812a61c51c296c1ad647d0096a6MD56license_urllicense_urltext/plain; charset=utf-852http://repositorio.ufpa.br/oai/bitstream/2011/1648/7/license_url3d480ae6c91e310daba2020f8787d6f9MD57TEXTDissertacao_ConversaoGrafemaFone.pdf.txtDissertacao_ConversaoGrafemaFone.pdf.txtExtracted texttext/plain138967http://repositorio.ufpa.br/oai/bitstream/2011/1648/8/Dissertacao_ConversaoGrafemaFone.pdf.txt8cc796270d7fbb8edb56dc0ecb7cfd80MD582011/16482018-02-26 13:12:24.312oai:repositorio.ufpa.br:2011/1648Repositório InstitucionalPUBhttp://repositorio.ufpa.br/oai/requestriufpabc@ufpa.bropendoar:21232018-02-26T16:12:24Repositório Institucional da UFPA - Universidade Federal do Pará (UFPA)false
dc.title.none.fl_str_mv Conversão grafema-fone para um sistema de reconhecimento de voz com suporte a grandes vocabulários para o português brasileiro
dc.title.alternative.none.fl_str_mv Conversion grapheme-phone for a system of recognition of voice with support the great vocabularies for the Brazilian Portuguese
title Conversão grafema-fone para um sistema de reconhecimento de voz com suporte a grandes vocabulários para o português brasileiro
spellingShingle Conversão grafema-fone para um sistema de reconhecimento de voz com suporte a grandes vocabulários para o português brasileiro
HOSN, Chadia Nadim Aboul
CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA::TELECOMUNICACOES::SISTEMAS DE TELECOMUNICACOES
Sistema de processamento de voz
Processamento de linguagem natural (Computação)
Ensino por computador
Língua portuguesa
title_short Conversão grafema-fone para um sistema de reconhecimento de voz com suporte a grandes vocabulários para o português brasileiro
title_full Conversão grafema-fone para um sistema de reconhecimento de voz com suporte a grandes vocabulários para o português brasileiro
title_fullStr Conversão grafema-fone para um sistema de reconhecimento de voz com suporte a grandes vocabulários para o português brasileiro
title_full_unstemmed Conversão grafema-fone para um sistema de reconhecimento de voz com suporte a grandes vocabulários para o português brasileiro
title_sort Conversão grafema-fone para um sistema de reconhecimento de voz com suporte a grandes vocabulários para o português brasileiro
author HOSN, Chadia Nadim Aboul
author_facet HOSN, Chadia Nadim Aboul
author_role author
dc.contributor.advisor1.fl_str_mv KLAUTAU JÚNIOR, Aldebaro Barreto da Rocha
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/1596629769697284
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/2478157567318435
dc.contributor.author.fl_str_mv HOSN, Chadia Nadim Aboul
contributor_str_mv KLAUTAU JÚNIOR, Aldebaro Barreto da Rocha
dc.subject.cnpq.fl_str_mv CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA::TELECOMUNICACOES::SISTEMAS DE TELECOMUNICACOES
topic CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA::TELECOMUNICACOES::SISTEMAS DE TELECOMUNICACOES
Sistema de processamento de voz
Processamento de linguagem natural (Computação)
Ensino por computador
Língua portuguesa
dc.subject.por.fl_str_mv Sistema de processamento de voz
Processamento de linguagem natural (Computação)
Ensino por computador
Língua portuguesa
description Speech processing has become a data-driven technology. Hence, the success of research in this area is linked to the existence of public corpora and associated resources, as a phonetic dictionary. In contrast to other languages such as English, one cannot find, in public domain, a Large Vocabulary Continuos Speech Recognition (LVCSR) System for Brazilian Portuguese. This work discusses some efforts within the FalaBrasil initiative [1], developed by researchers, teachers and students of the Signal Processing Laboratory (LaPS) at UFPA, providing an overview of the research and softwares related to Automatic Speech Recognition (ASR) for Brazilian Portuguese. More specifically, the present work discusses the implementation of a large vocabulary ASR for Brazilian Portuguese using the HTK software, which is based on hidden Markov models (HMM). Besides, the work discusses the implementation of a grapheme-phoneme conversion module using machine learning techniques.
publishDate 2006
dc.date.issued.fl_str_mv 2006-06-12
dc.date.accessioned.fl_str_mv 2011-03-23T21:19:13Z
dc.date.available.fl_str_mv 2011-03-23T21:19:13Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv HOSN, Chadia Nadim Aboul. Conversão grafema-fone para um sistema de reconhecimento de voz com suporte a grandes vocabulários para o português brasileiro. 2006. 77 f. Dissertação (Mestrado) - Universidade Federal do Pará, Instituto de Tecnologia, Belém, 2006. Programa de Pós-Graduação em Engenharia Elétrica.
dc.identifier.uri.fl_str_mv http://www.repositorio.ufpa.br:8080/jspui/handle/2011/1648
identifier_str_mv HOSN, Chadia Nadim Aboul. Conversão grafema-fone para um sistema de reconhecimento de voz com suporte a grandes vocabulários para o português brasileiro. 2006. 77 f. Dissertação (Mestrado) - Universidade Federal do Pará, Instituto de Tecnologia, Belém, 2006. Programa de Pós-Graduação em Engenharia Elétrica.
url http://www.repositorio.ufpa.br:8080/jspui/handle/2011/1648
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal do Pará
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Engenharia Elétrica
dc.publisher.initials.fl_str_mv UFPA
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Instituto de Tecnologia
publisher.none.fl_str_mv Universidade Federal do Pará
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPA
instname:Universidade Federal do Pará (UFPA)
instacron:UFPA
instname_str Universidade Federal do Pará (UFPA)
instacron_str UFPA
institution UFPA
reponame_str Repositório Institucional da UFPA
collection Repositório Institucional da UFPA
bitstream.url.fl_str_mv http://repositorio.ufpa.br/oai/bitstream/2011/1648/4/Dissertacao_ConversaoGrafemaFone.pdf
http://repositorio.ufpa.br/oai/bitstream/2011/1648/5/license_rdf
http://repositorio.ufpa.br/oai/bitstream/2011/1648/6/license_text
http://repositorio.ufpa.br/oai/bitstream/2011/1648/7/license_url
http://repositorio.ufpa.br/oai/bitstream/2011/1648/8/Dissertacao_ConversaoGrafemaFone.pdf.txt
bitstream.checksum.fl_str_mv 0edf59aee701ca9d66f85027806ac9b6
6b71892b27c4389434057b8b0e86b43e
1a64b812a61c51c296c1ad647d0096a6
3d480ae6c91e310daba2020f8787d6f9
8cc796270d7fbb8edb56dc0ecb7cfd80
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFPA - Universidade Federal do Pará (UFPA)
repository.mail.fl_str_mv riufpabc@ufpa.br
_version_ 1801771812358455296