Avanços em reconhecimento de fala para português brasileiro e aplicações: ditado no libreoffice e unidade de resposta audível com asterisk
Autor(a) principal: | |
---|---|
Data de Publicação: | 2013 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFPA |
Texto Completo: | http://repositorio.ufpa.br/jspui/handle/2011/4174 |
Resumo: | O reconhecimento automático de voz vem sendo cada vez mais útil e possível. Quando se trata de línguas como a Inglesa, encontram-se no mercado excelentes reconhecedores. Porem, a situação não e a mesma para o Português Brasileiro, onde os principais reconhecedores para ditado em sistemas desktop que já existiram foram descontinuados. A presente dissertação alinha-se com os objetivos do Laboratório de Processamento de Sinais da Universidade Federal do Pará, que é o desenvolvimento de um reconhecedor automático de voz para Português Brasileiro. Mais especificamente, as principais contribuições dessa dissertação são: o desenvolvimento de alguns recursos necessários para a construção de um reconhecedor, tais como: bases de áudio transcrito e API para desenvolvimento de aplicações; e o desenvolvimento de duas aplicações: uma para ditado em sistema desktop e outra para atendimento automático em um call center. O Coruja, sistema desenvolvido no LaPS para reconhecimento de voz em Português Brasileiro. Este alem de conter todos os recursos para fornecer reconhecimento de voz em Português Brasileiro possui uma API para desenvolvimento de aplicativos. O aplicativo desenvolvido para ditado e edição de textos em desktop e o SpeechOO, este possibilita o ditado para a ferramenta Writer do pacote LibreOffice, alem de permitir a edição e formatação de texto com comandos de voz. Outra contribuição deste trabalho e a utilização de reconhecimento automático de voz em call centers, o Coruja foi integrado ao software Asterisk e a principal aplicação desenvolvida foi uma unidade de resposta audível com reconhecimento de voz para o atendimento de um call center nacional que atende mais de 3 mil ligações diárias. |
id |
UFPA_b835b00776c1b55cf0d799dcc565075b |
---|---|
oai_identifier_str |
oai:repositorio.ufpa.br:2011/4174 |
network_acronym_str |
UFPA |
network_name_str |
Repositório Institucional da UFPA |
repository_id_str |
2123 |
spelling |
2013-08-23T15:23:15Z2013-08-23T15:23:15Z2013-03-04BATISTA, Pedro dos Santos. Avanços em reconhecimento de fala para português brasileiro e aplicações: ditado no libreoffice e unidade de resposta audível com asterisk. 2013. 79 f. Dissertação (Mestrado) - Universidade Federal do Pará, Instituto de Tecnologia, Belém, 2013. Programa de Pós-Graduação em Engenharia Elétrica.http://repositorio.ufpa.br/jspui/handle/2011/4174O reconhecimento automático de voz vem sendo cada vez mais útil e possível. Quando se trata de línguas como a Inglesa, encontram-se no mercado excelentes reconhecedores. Porem, a situação não e a mesma para o Português Brasileiro, onde os principais reconhecedores para ditado em sistemas desktop que já existiram foram descontinuados. A presente dissertação alinha-se com os objetivos do Laboratório de Processamento de Sinais da Universidade Federal do Pará, que é o desenvolvimento de um reconhecedor automático de voz para Português Brasileiro. Mais especificamente, as principais contribuições dessa dissertação são: o desenvolvimento de alguns recursos necessários para a construção de um reconhecedor, tais como: bases de áudio transcrito e API para desenvolvimento de aplicações; e o desenvolvimento de duas aplicações: uma para ditado em sistema desktop e outra para atendimento automático em um call center. O Coruja, sistema desenvolvido no LaPS para reconhecimento de voz em Português Brasileiro. Este alem de conter todos os recursos para fornecer reconhecimento de voz em Português Brasileiro possui uma API para desenvolvimento de aplicativos. O aplicativo desenvolvido para ditado e edição de textos em desktop e o SpeechOO, este possibilita o ditado para a ferramenta Writer do pacote LibreOffice, alem de permitir a edição e formatação de texto com comandos de voz. Outra contribuição deste trabalho e a utilização de reconhecimento automático de voz em call centers, o Coruja foi integrado ao software Asterisk e a principal aplicação desenvolvida foi uma unidade de resposta audível com reconhecimento de voz para o atendimento de um call center nacional que atende mais de 3 mil ligações diárias.Automatic speech recognition has been increasingly more useful and feasible. When it comes to languages such as English, there are excellent speech recognizers available. However, the situation is not the same for Brazilian Portuguese, where the few recognizers for desktop dictation that existed, are no longer available. This dissertation is aligned with a goal of the Signal Processing Laboratory at the Federal University of Para, which is the development of a complete automatic speech recognizer for Brazilian Portuguese. More specifically, the main contributions of this dissertation are: the development of some resources needed to build a speech recognizer such as transcribed audio database and speech API; and the development of two applications: one for desktop dictation and another for automatic service in a call center. The system developed in-house for automatic speech recognition in Brazilian Portuguese is called Coruja, and besides all the resources that makes automatic speech recognition in Brazilian Portuguese available, the Coruja also contains an API for application development using speech recognition. The application for desktop dictation is called SpeechOO. The SpeechOO enables dictation and text editing and formatting by voice for the LibreOffice Writer. Other contribution of this work is the use of Coruja in call centers. Coruja was integrated with the Asterisk software, which is the main open source software for call centers. The main application developed for automated service in call center was an interactive voice response which is deployed nationally and receives more than 3 thousand daily calls.porUniversidade Federal do ParáPrograma de Pós-Graduação em Engenharia ElétricaUFPABrasilInstituto de TecnologiaCNPQ::ENGENHARIAS::ENGENHARIA ELETRICA::TELECOMUNICACOESCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::ENGENHARIA DE SOFTWAREReconhecimento automático da vozCall centerSistema CorujaSoftware AsteriskAvanços em reconhecimento de fala para português brasileiro e aplicações: ditado no libreoffice e unidade de resposta audível com asteriskinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisKLAUTAU JÚNIOR, Aldebaro Barreto da Rochahttp://lattes.cnpq.br/1596629769697284SAMPAIO NETO, Nelson Cruzhttp://lattes.cnpq.br/9756167788721062http://lattes.cnpq.br/3636827760310107BATISTA, Pedro dos Santosinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFPAinstname:Universidade Federal do Pará (UFPA)instacron:UFPAORIGINALDissertacao_AvancosReconhecimentoFala.pdfDissertacao_AvancosReconhecimentoFala.pdfapplication/pdf830021http://repositorio.ufpa.br/oai/bitstream/2011/4174/1/Dissertacao_AvancosReconhecimentoFala.pdf66c2281f39ceb40eff9897cfe4299857MD51CC-LICENSElicense_urllicense_urltext/plain; charset=utf-852http://repositorio.ufpa.br/oai/bitstream/2011/4174/2/license_url3d480ae6c91e310daba2020f8787d6f9MD52license_textlicense_texttext/html; charset=utf-80http://repositorio.ufpa.br/oai/bitstream/2011/4174/3/license_textd41d8cd98f00b204e9800998ecf8427eMD53license_rdflicense_rdfapplication/rdf+xml; charset=utf-823898http://repositorio.ufpa.br/oai/bitstream/2011/4174/4/license_rdfe363e809996cf46ada20da1accfcd9c7MD54LICENSElicense.txtlicense.txttext/plain; charset=utf-81703http://repositorio.ufpa.br/oai/bitstream/2011/4174/5/license.txt1b17af3c3a621c3d44684a44b1c38961MD55TEXTDissertacao_AvancosReconhecimentoFala.pdf.txtDissertacao_AvancosReconhecimentoFala.pdf.txtExtracted texttext/plain164524http://repositorio.ufpa.br/oai/bitstream/2011/4174/6/Dissertacao_AvancosReconhecimentoFala.pdf.txt4f20229fd55646688cd30b4b711a4b3bMD562011/41742017-12-22 11:10:57.893oai:repositorio.ufpa.br:2011/4174TGljZW4/YSBkZSBkaXN0cmlidWk/P28gbj9vIGV4Y2x1c2l2YQoKQW8gYXNzaW5hciBlIGVudHJlZ2FyIGVzdGEgbGljZW4/YSwgdm9jPyBvKHMpIGF1dG9yIChlcykgb3UgcHJvcHJpZXQ/cmlvKHMpIGRvcyBkaXJlaXRvcyBhdXRvcmFpcywgIGNvbmNlZGUgYSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkbyBQYXI/IC0gVUZQQSwgbyBkaXJlaXRvIG4/byBleGNsdXNpdm8gZGUgcmVwcm9kdXppciwgdHJhZHV6aXIgKGNvbW8gZGVmaW5pZG8gYWJhaXhvKSwgZS9vdSBkaXN0cmlidWlyIHN1YSBzdWJtaXNzP28gKGluY2x1aW5kbyBvIHJlc3VtbykgZW0gdG9kbyBvIG11bmRvLCBlbSBmb3JtYXRvIGltcHJlc3NvIGUgZWxldHI/bmljbyBlIGVtIHF1YWxxdWVyIG1laW8sIGluY2x1aW5kbywgbWFzIG4/byBsaW1pdGFkbywgYSA/dWRpbyBvdSB2P2Rlby4KClZvYz8gY29uY29yZGEgcXVlIGEgVUZQQSBwb2RlLCBzZW0gYWx0ZXJhciBvIGNvbnRlP2RvLCB0cmFkdXppciBhIHN1Ym1pc3M/byBhIHF1YWxxdWVyIG1laW8gb3UgZm9ybWF0byBwYXJhIG8gcHJvcD9zaXRvIGRlIHByZXNlcnZhPz9vLgoKVm9jPyB0YW1iP20gY29uY29yZGEgcXVlIFVGUEEgcG9kZSBtYW50ZXIgbWFpcyBkZSB1bWEgYz9waWEgZGVzc2Egc3VibWlzcz9vIHBhcmEgZmlucyBkZSBzZWd1cmFuP2EsIGJhY2stdXAgZSBwcmVzZXJ2YT8/by4KClZvYz8gZGVjbGFyYSBxdWUgYSBhcHJlc2VudGE/P28gPyBvIHNldSB0cmFiYWxobyBvcmlnaW5hbCwgZSBxdWUgdm9jPyB0ZW0gbyBkaXJlaXRvIGRlIGNvbmNlZGVyIG9zIGRpcmVpdG9zIGNvbnRpZG9zIG5lc3RhIGxpY2VuP2EuIFZvYz8gdGFtYj9tIGRlY2xhcmEgcXVlIHN1YSBzdWJtaXNzP28sIGFvIHNldSBjb25oZWNpbWVudG8sIG4/byBpbmZyaW5nZSBvcyBkaXJlaXRvcyBhdXRvcmFpcyBkZSBhbGd1P20uCgpTZSBvIGRvY3VtZW50byBlbnRyZWd1ZSBjb250P20gbWF0ZXJpYWwgcGFyYSBvIHF1YWwgdm9jPyBuP28gdGVtIGRpcmVpdG9zIGF1dG9yYWlzLCBWb2M/IGRlY2xhcmEgcXVlIG9idGV2ZSBhIHBlcm1pc3M/byBpcnJlc3RyaXRhIGRvIHByb3ByaWV0P3JpbyBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgcGFyYSBjb25jZWRlciBhIFVGUEEgb3MgZGlyZWl0b3MgcmVxdWVyaWRvcyBwb3IgZXN0YSBsaWNlbj9hLCBlIHF1ZSBtYXRlcmlhaXMgZGUgdGVyY2Vpcm9zIGVzdD8gY2xhcmFtZW50ZSBpZGVudGlmaWNhZG8gZSByZWNvbmhlY2lkbyBubyB0ZXh0byBvdSBjb250ZT9kbyBkYSBhcHJlc2VudGE/P28uCgpTZSBhIHN1Ym1pc3M/byA/IGJhc2VhZGEgbm8gdHJhYmFsaG8gcXVlIHRlbSBzaWRvIHBhdHJvY2luYWRvIG91IGFwb2lhZG8gcG9yIHVtID9yZz9vIG91IG91dHJhIG9yZ2FuaXphPz9vIHF1ZSBuP28gc2VqYSBhIFVGUEEsIHZvYz8gZGVjbGFyYSB0ZXIgY3VtcHJpZG8gcXVhbHF1ZXIgZGlyZWl0byBkZSByZXZpcz9vIG91IG91dHJhcyBvYnJpZ2E/Pz9lcyByZXF1ZXJpZGFzIHBlbG8gY29udHJhdG8gb3UgYWNvcmRvLgoKQSBVRlBBIGlyPyBpZGVudGlmaWNhciBjbGFyYW1lbnRlIG8ocykgc2V1KHMpIG5vbWUocykgY29tbyBvKHMpIGF1dG9yIChlcykgb3UgcHJvcHJpZXQ/cmlvKHMpIGRhIHN1Ym1pc3M/bywgZSBuP28gZmFyPyBxdWFscXVlciBhbHRlcmE/P28sIGFsP20gZGFzIHBlcm1pdGlkYXMgcG9yIGVzdGEgbGljZW4/YSwgYSBzdWEgc3VibWlzcz9vLgo=Repositório InstitucionalPUBhttp://repositorio.ufpa.br/oai/requestriufpabc@ufpa.bropendoar:21232017-12-22T14:10:57Repositório Institucional da UFPA - Universidade Federal do Pará (UFPA)false |
dc.title.pt_BR.fl_str_mv |
Avanços em reconhecimento de fala para português brasileiro e aplicações: ditado no libreoffice e unidade de resposta audível com asterisk |
title |
Avanços em reconhecimento de fala para português brasileiro e aplicações: ditado no libreoffice e unidade de resposta audível com asterisk |
spellingShingle |
Avanços em reconhecimento de fala para português brasileiro e aplicações: ditado no libreoffice e unidade de resposta audível com asterisk BATISTA, Pedro dos Santos CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA::TELECOMUNICACOES CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::ENGENHARIA DE SOFTWARE Reconhecimento automático da voz Call center Sistema Coruja Software Asterisk |
title_short |
Avanços em reconhecimento de fala para português brasileiro e aplicações: ditado no libreoffice e unidade de resposta audível com asterisk |
title_full |
Avanços em reconhecimento de fala para português brasileiro e aplicações: ditado no libreoffice e unidade de resposta audível com asterisk |
title_fullStr |
Avanços em reconhecimento de fala para português brasileiro e aplicações: ditado no libreoffice e unidade de resposta audível com asterisk |
title_full_unstemmed |
Avanços em reconhecimento de fala para português brasileiro e aplicações: ditado no libreoffice e unidade de resposta audível com asterisk |
title_sort |
Avanços em reconhecimento de fala para português brasileiro e aplicações: ditado no libreoffice e unidade de resposta audível com asterisk |
author |
BATISTA, Pedro dos Santos |
author_facet |
BATISTA, Pedro dos Santos |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
KLAUTAU JÚNIOR, Aldebaro Barreto da Rocha |
dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/1596629769697284 |
dc.contributor.advisor-co1.fl_str_mv |
SAMPAIO NETO, Nelson Cruz |
dc.contributor.advisor-co1Lattes.fl_str_mv |
http://lattes.cnpq.br/9756167788721062 |
dc.contributor.authorLattes.fl_str_mv |
http://lattes.cnpq.br/3636827760310107 |
dc.contributor.author.fl_str_mv |
BATISTA, Pedro dos Santos |
contributor_str_mv |
KLAUTAU JÚNIOR, Aldebaro Barreto da Rocha SAMPAIO NETO, Nelson Cruz |
dc.subject.cnpq.fl_str_mv |
CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA::TELECOMUNICACOES CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::ENGENHARIA DE SOFTWARE |
topic |
CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA::TELECOMUNICACOES CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::ENGENHARIA DE SOFTWARE Reconhecimento automático da voz Call center Sistema Coruja Software Asterisk |
dc.subject.por.fl_str_mv |
Reconhecimento automático da voz Call center Sistema Coruja Software Asterisk |
description |
O reconhecimento automático de voz vem sendo cada vez mais útil e possível. Quando se trata de línguas como a Inglesa, encontram-se no mercado excelentes reconhecedores. Porem, a situação não e a mesma para o Português Brasileiro, onde os principais reconhecedores para ditado em sistemas desktop que já existiram foram descontinuados. A presente dissertação alinha-se com os objetivos do Laboratório de Processamento de Sinais da Universidade Federal do Pará, que é o desenvolvimento de um reconhecedor automático de voz para Português Brasileiro. Mais especificamente, as principais contribuições dessa dissertação são: o desenvolvimento de alguns recursos necessários para a construção de um reconhecedor, tais como: bases de áudio transcrito e API para desenvolvimento de aplicações; e o desenvolvimento de duas aplicações: uma para ditado em sistema desktop e outra para atendimento automático em um call center. O Coruja, sistema desenvolvido no LaPS para reconhecimento de voz em Português Brasileiro. Este alem de conter todos os recursos para fornecer reconhecimento de voz em Português Brasileiro possui uma API para desenvolvimento de aplicativos. O aplicativo desenvolvido para ditado e edição de textos em desktop e o SpeechOO, este possibilita o ditado para a ferramenta Writer do pacote LibreOffice, alem de permitir a edição e formatação de texto com comandos de voz. Outra contribuição deste trabalho e a utilização de reconhecimento automático de voz em call centers, o Coruja foi integrado ao software Asterisk e a principal aplicação desenvolvida foi uma unidade de resposta audível com reconhecimento de voz para o atendimento de um call center nacional que atende mais de 3 mil ligações diárias. |
publishDate |
2013 |
dc.date.accessioned.fl_str_mv |
2013-08-23T15:23:15Z |
dc.date.available.fl_str_mv |
2013-08-23T15:23:15Z |
dc.date.issued.fl_str_mv |
2013-03-04 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
BATISTA, Pedro dos Santos. Avanços em reconhecimento de fala para português brasileiro e aplicações: ditado no libreoffice e unidade de resposta audível com asterisk. 2013. 79 f. Dissertação (Mestrado) - Universidade Federal do Pará, Instituto de Tecnologia, Belém, 2013. Programa de Pós-Graduação em Engenharia Elétrica. |
dc.identifier.uri.fl_str_mv |
http://repositorio.ufpa.br/jspui/handle/2011/4174 |
identifier_str_mv |
BATISTA, Pedro dos Santos. Avanços em reconhecimento de fala para português brasileiro e aplicações: ditado no libreoffice e unidade de resposta audível com asterisk. 2013. 79 f. Dissertação (Mestrado) - Universidade Federal do Pará, Instituto de Tecnologia, Belém, 2013. Programa de Pós-Graduação em Engenharia Elétrica. |
url |
http://repositorio.ufpa.br/jspui/handle/2011/4174 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal do Pará |
dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Engenharia Elétrica |
dc.publisher.initials.fl_str_mv |
UFPA |
dc.publisher.country.fl_str_mv |
Brasil |
dc.publisher.department.fl_str_mv |
Instituto de Tecnologia |
publisher.none.fl_str_mv |
Universidade Federal do Pará |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFPA instname:Universidade Federal do Pará (UFPA) instacron:UFPA |
instname_str |
Universidade Federal do Pará (UFPA) |
instacron_str |
UFPA |
institution |
UFPA |
reponame_str |
Repositório Institucional da UFPA |
collection |
Repositório Institucional da UFPA |
bitstream.url.fl_str_mv |
http://repositorio.ufpa.br/oai/bitstream/2011/4174/1/Dissertacao_AvancosReconhecimentoFala.pdf http://repositorio.ufpa.br/oai/bitstream/2011/4174/2/license_url http://repositorio.ufpa.br/oai/bitstream/2011/4174/3/license_text http://repositorio.ufpa.br/oai/bitstream/2011/4174/4/license_rdf http://repositorio.ufpa.br/oai/bitstream/2011/4174/5/license.txt http://repositorio.ufpa.br/oai/bitstream/2011/4174/6/Dissertacao_AvancosReconhecimentoFala.pdf.txt |
bitstream.checksum.fl_str_mv |
66c2281f39ceb40eff9897cfe4299857 3d480ae6c91e310daba2020f8787d6f9 d41d8cd98f00b204e9800998ecf8427e e363e809996cf46ada20da1accfcd9c7 1b17af3c3a621c3d44684a44b1c38961 4f20229fd55646688cd30b4b711a4b3b |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFPA - Universidade Federal do Pará (UFPA) |
repository.mail.fl_str_mv |
riufpabc@ufpa.br |
_version_ |
1801771881977610240 |