Conversão grafema-fone para um sistema de reconhecimento de voz com suporte a grandes vocabulários para o português brasileiro
Autor(a) principal: | |
---|---|
Data de Publicação: | 2006 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFPA |
Texto Completo: | http://www.repositorio.ufpa.br:8080/jspui/handle/2011/1648 |
Resumo: | Speech processing has become a data-driven technology. Hence, the success of research in this area is linked to the existence of public corpora and associated resources, as a phonetic dictionary. In contrast to other languages such as English, one cannot find, in public domain, a Large Vocabulary Continuos Speech Recognition (LVCSR) System for Brazilian Portuguese. This work discusses some efforts within the FalaBrasil initiative [1], developed by researchers, teachers and students of the Signal Processing Laboratory (LaPS) at UFPA, providing an overview of the research and softwares related to Automatic Speech Recognition (ASR) for Brazilian Portuguese. More specifically, the present work discusses the implementation of a large vocabulary ASR for Brazilian Portuguese using the HTK software, which is based on hidden Markov models (HMM). Besides, the work discusses the implementation of a grapheme-phoneme conversion module using machine learning techniques. |
id |
UFPA_b89eef3190b9ee1c5350ec9b0cd6963a |
---|---|
oai_identifier_str |
oai:repositorio.ufpa.br:2011/1648 |
network_acronym_str |
UFPA |
network_name_str |
Repositório Institucional da UFPA |
repository_id_str |
2123 |
spelling |
2011-03-23T21:19:13Z2011-03-23T21:19:13Z2006-06-12HOSN, Chadia Nadim Aboul. Conversão grafema-fone para um sistema de reconhecimento de voz com suporte a grandes vocabulários para o português brasileiro. 2006. 77 f. Dissertação (Mestrado) - Universidade Federal do Pará, Instituto de Tecnologia, Belém, 2006. Programa de Pós-Graduação em Engenharia Elétrica.http://www.repositorio.ufpa.br:8080/jspui/handle/2011/1648Speech processing has become a data-driven technology. Hence, the success of research in this area is linked to the existence of public corpora and associated resources, as a phonetic dictionary. In contrast to other languages such as English, one cannot find, in public domain, a Large Vocabulary Continuos Speech Recognition (LVCSR) System for Brazilian Portuguese. This work discusses some efforts within the FalaBrasil initiative [1], developed by researchers, teachers and students of the Signal Processing Laboratory (LaPS) at UFPA, providing an overview of the research and softwares related to Automatic Speech Recognition (ASR) for Brazilian Portuguese. More specifically, the present work discusses the implementation of a large vocabulary ASR for Brazilian Portuguese using the HTK software, which is based on hidden Markov models (HMM). Besides, the work discusses the implementation of a grapheme-phoneme conversion module using machine learning techniques.O processamento de voz tornou-se uma tecnologia cada vez mais baseada na modelagem automática de vasta quantidade de dados. Desta forma, o sucesso das pesquisas nesta área está diretamente ligado a existência de corpora de domínio público e outros recursos específicos, tal como um dicionário fonético. No Brasil, ao contrário do que acontece para a língua inglesa, por exemplo, não existe atualmente em domínio público um sistema de Reconhecimento Automático de Voz (RAV) para o Português Brasileiro com suporte a grandes vocabulários. Frente a este cenário, o trabalho tem como principal objetivo discutir esforços dentro da iniciativa FalaBrasil [1], criada pelo Laboratório de Processamento de Sinais (LaPS) da UFPA, apresentando pesquisas e softwares na área de RAV para o Português do Brasil. Mais especificamente, o presente trabalho discute a implementação de um sistema de reconhecimento de voz com suporte a grandes vocabulários para o Português do Brasil, utilizando a ferramenta HTK baseada em modelo oculto de Markov (HMM) e a criação de um módulo de conversão grafema-fone, utilizando técnicas de aprendizado de máquina.porUniversidade Federal do ParáPrograma de Pós-Graduação em Engenharia ElétricaUFPABrasilInstituto de TecnologiaCNPQ::ENGENHARIAS::ENGENHARIA ELETRICA::TELECOMUNICACOES::SISTEMAS DE TELECOMUNICACOESSistema de processamento de vozProcessamento de linguagem natural (Computação)Ensino por computadorLíngua portuguesaConversão grafema-fone para um sistema de reconhecimento de voz com suporte a grandes vocabulários para o português brasileiroConversion grapheme-phone for a system of recognition of voice with support the great vocabularies for the Brazilian Portugueseinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisKLAUTAU JÚNIOR, Aldebaro Barreto da Rochahttp://lattes.cnpq.br/1596629769697284http://lattes.cnpq.br/2478157567318435HOSN, Chadia Nadim Aboulinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFPAinstname:Universidade Federal do Pará (UFPA)instacron:UFPAORIGINALDissertacao_ConversaoGrafemaFone.pdfDissertacao_ConversaoGrafemaFone.pdfapplication/pdf1673670http://repositorio.ufpa.br/oai/bitstream/2011/1648/4/Dissertacao_ConversaoGrafemaFone.pdf0edf59aee701ca9d66f85027806ac9b6MD54CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-823930http://repositorio.ufpa.br/oai/bitstream/2011/1648/5/license_rdf6b71892b27c4389434057b8b0e86b43eMD55license_textlicense_texttext/html; charset=utf-823738http://repositorio.ufpa.br/oai/bitstream/2011/1648/6/license_text1a64b812a61c51c296c1ad647d0096a6MD56license_urllicense_urltext/plain; charset=utf-852http://repositorio.ufpa.br/oai/bitstream/2011/1648/7/license_url3d480ae6c91e310daba2020f8787d6f9MD57TEXTDissertacao_ConversaoGrafemaFone.pdf.txtDissertacao_ConversaoGrafemaFone.pdf.txtExtracted texttext/plain138967http://repositorio.ufpa.br/oai/bitstream/2011/1648/8/Dissertacao_ConversaoGrafemaFone.pdf.txt8cc796270d7fbb8edb56dc0ecb7cfd80MD582011/16482018-02-26 13:12:24.312oai:repositorio.ufpa.br:2011/1648Repositório InstitucionalPUBhttp://repositorio.ufpa.br/oai/requestriufpabc@ufpa.bropendoar:21232018-02-26T16:12:24Repositório Institucional da UFPA - Universidade Federal do Pará (UFPA)false |
dc.title.none.fl_str_mv |
Conversão grafema-fone para um sistema de reconhecimento de voz com suporte a grandes vocabulários para o português brasileiro |
dc.title.alternative.none.fl_str_mv |
Conversion grapheme-phone for a system of recognition of voice with support the great vocabularies for the Brazilian Portuguese |
title |
Conversão grafema-fone para um sistema de reconhecimento de voz com suporte a grandes vocabulários para o português brasileiro |
spellingShingle |
Conversão grafema-fone para um sistema de reconhecimento de voz com suporte a grandes vocabulários para o português brasileiro HOSN, Chadia Nadim Aboul CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA::TELECOMUNICACOES::SISTEMAS DE TELECOMUNICACOES Sistema de processamento de voz Processamento de linguagem natural (Computação) Ensino por computador Língua portuguesa |
title_short |
Conversão grafema-fone para um sistema de reconhecimento de voz com suporte a grandes vocabulários para o português brasileiro |
title_full |
Conversão grafema-fone para um sistema de reconhecimento de voz com suporte a grandes vocabulários para o português brasileiro |
title_fullStr |
Conversão grafema-fone para um sistema de reconhecimento de voz com suporte a grandes vocabulários para o português brasileiro |
title_full_unstemmed |
Conversão grafema-fone para um sistema de reconhecimento de voz com suporte a grandes vocabulários para o português brasileiro |
title_sort |
Conversão grafema-fone para um sistema de reconhecimento de voz com suporte a grandes vocabulários para o português brasileiro |
author |
HOSN, Chadia Nadim Aboul |
author_facet |
HOSN, Chadia Nadim Aboul |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
KLAUTAU JÚNIOR, Aldebaro Barreto da Rocha |
dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/1596629769697284 |
dc.contributor.authorLattes.fl_str_mv |
http://lattes.cnpq.br/2478157567318435 |
dc.contributor.author.fl_str_mv |
HOSN, Chadia Nadim Aboul |
contributor_str_mv |
KLAUTAU JÚNIOR, Aldebaro Barreto da Rocha |
dc.subject.cnpq.fl_str_mv |
CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA::TELECOMUNICACOES::SISTEMAS DE TELECOMUNICACOES |
topic |
CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA::TELECOMUNICACOES::SISTEMAS DE TELECOMUNICACOES Sistema de processamento de voz Processamento de linguagem natural (Computação) Ensino por computador Língua portuguesa |
dc.subject.por.fl_str_mv |
Sistema de processamento de voz Processamento de linguagem natural (Computação) Ensino por computador Língua portuguesa |
description |
Speech processing has become a data-driven technology. Hence, the success of research in this area is linked to the existence of public corpora and associated resources, as a phonetic dictionary. In contrast to other languages such as English, one cannot find, in public domain, a Large Vocabulary Continuos Speech Recognition (LVCSR) System for Brazilian Portuguese. This work discusses some efforts within the FalaBrasil initiative [1], developed by researchers, teachers and students of the Signal Processing Laboratory (LaPS) at UFPA, providing an overview of the research and softwares related to Automatic Speech Recognition (ASR) for Brazilian Portuguese. More specifically, the present work discusses the implementation of a large vocabulary ASR for Brazilian Portuguese using the HTK software, which is based on hidden Markov models (HMM). Besides, the work discusses the implementation of a grapheme-phoneme conversion module using machine learning techniques. |
publishDate |
2006 |
dc.date.issued.fl_str_mv |
2006-06-12 |
dc.date.accessioned.fl_str_mv |
2011-03-23T21:19:13Z |
dc.date.available.fl_str_mv |
2011-03-23T21:19:13Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
HOSN, Chadia Nadim Aboul. Conversão grafema-fone para um sistema de reconhecimento de voz com suporte a grandes vocabulários para o português brasileiro. 2006. 77 f. Dissertação (Mestrado) - Universidade Federal do Pará, Instituto de Tecnologia, Belém, 2006. Programa de Pós-Graduação em Engenharia Elétrica. |
dc.identifier.uri.fl_str_mv |
http://www.repositorio.ufpa.br:8080/jspui/handle/2011/1648 |
identifier_str_mv |
HOSN, Chadia Nadim Aboul. Conversão grafema-fone para um sistema de reconhecimento de voz com suporte a grandes vocabulários para o português brasileiro. 2006. 77 f. Dissertação (Mestrado) - Universidade Federal do Pará, Instituto de Tecnologia, Belém, 2006. Programa de Pós-Graduação em Engenharia Elétrica. |
url |
http://www.repositorio.ufpa.br:8080/jspui/handle/2011/1648 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal do Pará |
dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Engenharia Elétrica |
dc.publisher.initials.fl_str_mv |
UFPA |
dc.publisher.country.fl_str_mv |
Brasil |
dc.publisher.department.fl_str_mv |
Instituto de Tecnologia |
publisher.none.fl_str_mv |
Universidade Federal do Pará |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFPA instname:Universidade Federal do Pará (UFPA) instacron:UFPA |
instname_str |
Universidade Federal do Pará (UFPA) |
instacron_str |
UFPA |
institution |
UFPA |
reponame_str |
Repositório Institucional da UFPA |
collection |
Repositório Institucional da UFPA |
bitstream.url.fl_str_mv |
http://repositorio.ufpa.br/oai/bitstream/2011/1648/4/Dissertacao_ConversaoGrafemaFone.pdf http://repositorio.ufpa.br/oai/bitstream/2011/1648/5/license_rdf http://repositorio.ufpa.br/oai/bitstream/2011/1648/6/license_text http://repositorio.ufpa.br/oai/bitstream/2011/1648/7/license_url http://repositorio.ufpa.br/oai/bitstream/2011/1648/8/Dissertacao_ConversaoGrafemaFone.pdf.txt |
bitstream.checksum.fl_str_mv |
0edf59aee701ca9d66f85027806ac9b6 6b71892b27c4389434057b8b0e86b43e 1a64b812a61c51c296c1ad647d0096a6 3d480ae6c91e310daba2020f8787d6f9 8cc796270d7fbb8edb56dc0ecb7cfd80 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFPA - Universidade Federal do Pará (UFPA) |
repository.mail.fl_str_mv |
riufpabc@ufpa.br |
_version_ |
1801771812358455296 |