Reconhecimento de palavras por modelos ocultos de Markov.

Detalhes bibliográficos
Autor(a) principal: Scavone, André Pasquale Rocco
Data de Publicação: 1996
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da USP
Texto Completo: https://www.teses.usp.br/teses/disponiveis/3/3142/tde-22082024-101705/
Resumo: O uso de modelos ocultos de Markov (HMM) na tarefa de reconhecimento de voz tem sido objeto de extensa pesquisa. Esses modelos utilizam dois processos estatísticos inter-relacionados: enquanto um modelo a variabilidade dos ritmos de emissao, o outro representa a diversidade dos fenômenos acústicos da fala. Este segundo processo permitiria também absorver as características de diferentes vozes. Este trabalho estuda o uso dos modelos ocultos de Markov através da implementação de um sistema de reconhecimento de vocabulário restrito. O sistema utiliza a análise por coeficientes de predição linear e quantização vetorial para representar o sinal de voz por uma sequência de símbolos que estima os parâmetros dos modelos. Os resultados obtidos com um locutor confirmam a capacidade de representação desses modelos. No entanto, o desempenho do sistema se reduz consideravelmente quando aplicado a diversos locutores. Algumas alternativas são propostas no sentido de melhorar o desempenho do sistema, sem atingir grande exito. As soluções para a independência do locutor apontam para métodos adaptativos que preservem a versatilidade dos HMM.
id USP_2abd920d6d3186e396fb4c5fb6af0700
oai_identifier_str oai:teses.usp.br:tde-22082024-101705
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str 2721
spelling Reconhecimento de palavras por modelos ocultos de Markov.Untitled in englishReconhecimento de vozVoice recognitionO uso de modelos ocultos de Markov (HMM) na tarefa de reconhecimento de voz tem sido objeto de extensa pesquisa. Esses modelos utilizam dois processos estatísticos inter-relacionados: enquanto um modelo a variabilidade dos ritmos de emissao, o outro representa a diversidade dos fenômenos acústicos da fala. Este segundo processo permitiria também absorver as características de diferentes vozes. Este trabalho estuda o uso dos modelos ocultos de Markov através da implementação de um sistema de reconhecimento de vocabulário restrito. O sistema utiliza a análise por coeficientes de predição linear e quantização vetorial para representar o sinal de voz por uma sequência de símbolos que estima os parâmetros dos modelos. Os resultados obtidos com um locutor confirmam a capacidade de representação desses modelos. No entanto, o desempenho do sistema se reduz consideravelmente quando aplicado a diversos locutores. Algumas alternativas são propostas no sentido de melhorar o desempenho do sistema, sem atingir grande exito. As soluções para a independência do locutor apontam para métodos adaptativos que preservem a versatilidade dos HMM.The use of hidden Markov models (HMM) in autyomatic speech recognition has been object of extensive research. These models use two inter-related statistics processes, one modeling the variability of the utterances rythms while the other describes the diversity of speech accoustical phenomena. The later would also be able to manage the features of different individual voices. This work studies the use of hidden Markov models through a recognition system for a restricted vocabular. The system uses the linear coeficiente prediction analysis and vector quantization to represent the voice signal by sequences of symbols to estimate model parameters. The results achieved with a single speaker support the representation capability of these models. However, system performance drops significantly whrn applied to different speakers. Some alternatives are proposed to improve the system in this way, without achievieng better results. The solutions for speaker-independent tasks points to adaptative methods preserving HMM versatility.Biblioteca Digitais de Teses e Dissertações da USPCampos, Geraldo Lino deScavone, André Pasquale Rocco1996-05-31info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/3/3142/tde-22082024-101705/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2024-08-22T13:45:03Zoai:teses.usp.br:tde-22082024-101705Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212024-08-22T13:45:03Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Reconhecimento de palavras por modelos ocultos de Markov.
Untitled in english
title Reconhecimento de palavras por modelos ocultos de Markov.
spellingShingle Reconhecimento de palavras por modelos ocultos de Markov.
Scavone, André Pasquale Rocco
Reconhecimento de voz
Voice recognition
title_short Reconhecimento de palavras por modelos ocultos de Markov.
title_full Reconhecimento de palavras por modelos ocultos de Markov.
title_fullStr Reconhecimento de palavras por modelos ocultos de Markov.
title_full_unstemmed Reconhecimento de palavras por modelos ocultos de Markov.
title_sort Reconhecimento de palavras por modelos ocultos de Markov.
author Scavone, André Pasquale Rocco
author_facet Scavone, André Pasquale Rocco
author_role author
dc.contributor.none.fl_str_mv Campos, Geraldo Lino de
dc.contributor.author.fl_str_mv Scavone, André Pasquale Rocco
dc.subject.por.fl_str_mv Reconhecimento de voz
Voice recognition
topic Reconhecimento de voz
Voice recognition
description O uso de modelos ocultos de Markov (HMM) na tarefa de reconhecimento de voz tem sido objeto de extensa pesquisa. Esses modelos utilizam dois processos estatísticos inter-relacionados: enquanto um modelo a variabilidade dos ritmos de emissao, o outro representa a diversidade dos fenômenos acústicos da fala. Este segundo processo permitiria também absorver as características de diferentes vozes. Este trabalho estuda o uso dos modelos ocultos de Markov através da implementação de um sistema de reconhecimento de vocabulário restrito. O sistema utiliza a análise por coeficientes de predição linear e quantização vetorial para representar o sinal de voz por uma sequência de símbolos que estima os parâmetros dos modelos. Os resultados obtidos com um locutor confirmam a capacidade de representação desses modelos. No entanto, o desempenho do sistema se reduz consideravelmente quando aplicado a diversos locutores. Algumas alternativas são propostas no sentido de melhorar o desempenho do sistema, sem atingir grande exito. As soluções para a independência do locutor apontam para métodos adaptativos que preservem a versatilidade dos HMM.
publishDate 1996
dc.date.none.fl_str_mv 1996-05-31
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/3/3142/tde-22082024-101705/
url https://www.teses.usp.br/teses/disponiveis/3/3142/tde-22082024-101705/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1815257280189300736