Reconhecimento de fala continua usando modelos ocultos de Markov
Autor(a) principal: | |
---|---|
Data de Publicação: | 1999 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
Texto Completo: | https://hdl.handle.net/20.500.12733/1587689 |
Resumo: | Orientador: Fabio Violaro |
id |
UNICAMP-30_c859e350ff9b3e522051ce65ec1292c0 |
---|---|
oai_identifier_str |
oai::175850 |
network_acronym_str |
UNICAMP-30 |
network_name_str |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
repository_id_str |
|
spelling |
Reconhecimento de fala continua usando modelos ocultos de MarkovProcessos de MarkovReconhecimento automático da vozProcessamento de sinais - Técnicas digitaisReconhecimento automatico da falaOrientador: Fabio ViolaroTese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de ComputaçãoResumo: Nos sistemas que constituem o estado da arte na área de reconhecimento de fala predominam os modelos estatísticos, notadamente aqueles baseados em Modelos Ocultos de Markov (Hidden Markov Models, HMM) Os HMM¿s são estruturas poderosas pois são capazes de modelar ao mesmo tempo as variabilidades acústicas e temporais do sinal de voz. Métodos estatísticos são extremamente vorazes quando se trata de dados de treinamento. Deste modo, nos sistemas de reconhecimento de fala contínua e vocabulário extenso, as palavras são geralmente modeladas a partir da concatenação de sub-unidades fonéticas, pois o número destas é bem menor do que o de palavras, e em uma locução geralmente existem vários exemplos de sub-unidades fonéticas. O reconhecimento de fala contínua difere do de palavras isoladas, pois neste o locutor não precisa fazer pausas entre as palavras. Deste modo, a determinação das fronteiras entre as palavras e do número destas na locução deve ser feita pelo sistema de reconhecimento. Para isto são utilizados os algoritmos de busca, que podem ter ainda modelos de duração e de linguagem incorporados. O objetivo deste trabalho é estudar o problema de reconhecimento de fala contínua, com independência de locutor e vocabulário médio (aproximadamente 700 palavras) utilizando HMM¿s... Observação: O resumo, na íntegra, poderá ser visualizado no texto completo da tese digitalAbstract: In the field of continuous speech recognition, current state of art systems make use of statistical methods, mainly those based on Hidden Markov Models (HMM). HMM are powerful due to their ability to model both the acoustic and temporal features of speech signals. Statistical methods require lots of training samples. For this reason, large vocabulary, continuous speech recognition systems use word models composed by concatenating subunit models. In this approach there are much fewer subunits than words, and many samples of them in a single utterance. The main difference between continuous speech recognition and isolated words speech recognition is basically in the way that users interact with the system. In isolated words speech recognition, the user needs to make short pauses between works, which is not required for continuous speech recognition systems. The determination of word boundaries, and consequently the number of words in the utterance, take a part of the recognition process in continuous speech recognition systems. For this task searching algorithms are used, and they can also incorporate word duration and language models. The purpose of this work is to study the problem of speaker independent, medium-size vocabulary (about 700 words), continuous speech recognition using HMM¿s... Note: The complete abstract is available with the full electronic digital thesis or dissertationsDoutoradoDoutor em Engenharia Elétrica[s.n.]Violaro, Fábio, 1950-Alcaim, AbrahanSanches, IvandroMeloni, Luís Geraldo PedrosoLee, Luan LingUniversidade Estadual de Campinas (UNICAMP). Faculdade de Engenharia Elétrica e de ComputaçãoPrograma de Pós-Graduação em Engenharia ElétricaUNIVERSIDADE ESTADUAL DE CAMPINASYnoguti, Carlos Alberto19991999-05-28T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdf138 p.(Broch.)https://hdl.handle.net/20.500.12733/1587689YNOGUTI, Carlos Alberto. Reconhecimento de fala continua usando modelos ocultos de Markov. 1999. 138 p. Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1587689. Acesso em: 2 set. 2024.https://repositorio.unicamp.br/acervo/detalhe/175850porreponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)instname:Universidade Estadual de Campinas (UNICAMP)instacron:UNICAMPinfo:eu-repo/semantics/openAccess2017-02-18T02:58:01Zoai::175850Biblioteca Digital de Teses e DissertaçõesPUBhttp://repositorio.unicamp.br/oai/tese/oai.aspsbubd@unicamp.bropendoar:2017-02-18T02:58:01Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)false |
dc.title.none.fl_str_mv |
Reconhecimento de fala continua usando modelos ocultos de Markov |
title |
Reconhecimento de fala continua usando modelos ocultos de Markov |
spellingShingle |
Reconhecimento de fala continua usando modelos ocultos de Markov Ynoguti, Carlos Alberto Processos de Markov Reconhecimento automático da voz Processamento de sinais - Técnicas digitais Reconhecimento automatico da fala |
title_short |
Reconhecimento de fala continua usando modelos ocultos de Markov |
title_full |
Reconhecimento de fala continua usando modelos ocultos de Markov |
title_fullStr |
Reconhecimento de fala continua usando modelos ocultos de Markov |
title_full_unstemmed |
Reconhecimento de fala continua usando modelos ocultos de Markov |
title_sort |
Reconhecimento de fala continua usando modelos ocultos de Markov |
author |
Ynoguti, Carlos Alberto |
author_facet |
Ynoguti, Carlos Alberto |
author_role |
author |
dc.contributor.none.fl_str_mv |
Violaro, Fábio, 1950- Alcaim, Abrahan Sanches, Ivandro Meloni, Luís Geraldo Pedroso Lee, Luan Ling Universidade Estadual de Campinas (UNICAMP). Faculdade de Engenharia Elétrica e de Computação Programa de Pós-Graduação em Engenharia Elétrica UNIVERSIDADE ESTADUAL DE CAMPINAS |
dc.contributor.author.fl_str_mv |
Ynoguti, Carlos Alberto |
dc.subject.por.fl_str_mv |
Processos de Markov Reconhecimento automático da voz Processamento de sinais - Técnicas digitais Reconhecimento automatico da fala |
topic |
Processos de Markov Reconhecimento automático da voz Processamento de sinais - Técnicas digitais Reconhecimento automatico da fala |
description |
Orientador: Fabio Violaro |
publishDate |
1999 |
dc.date.none.fl_str_mv |
1999 1999-05-28T00:00:00Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
(Broch.) https://hdl.handle.net/20.500.12733/1587689 YNOGUTI, Carlos Alberto. Reconhecimento de fala continua usando modelos ocultos de Markov. 1999. 138 p. Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1587689. Acesso em: 2 set. 2024. |
identifier_str_mv |
(Broch.) YNOGUTI, Carlos Alberto. Reconhecimento de fala continua usando modelos ocultos de Markov. 1999. 138 p. Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1587689. Acesso em: 2 set. 2024. |
url |
https://hdl.handle.net/20.500.12733/1587689 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
https://repositorio.unicamp.br/acervo/detalhe/175850 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf 138 p. |
dc.publisher.none.fl_str_mv |
[s.n.] |
publisher.none.fl_str_mv |
[s.n.] |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) instname:Universidade Estadual de Campinas (UNICAMP) instacron:UNICAMP |
instname_str |
Universidade Estadual de Campinas (UNICAMP) |
instacron_str |
UNICAMP |
institution |
UNICAMP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
collection |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP) |
repository.mail.fl_str_mv |
sbubd@unicamp.br |
_version_ |
1809188825987022848 |