Reconhecimento de palavras por modelos ocultos de Markov.

Scavone, André Pasquale Rocco

Reconhecimento de palavras por modelos ocultos de Markov.

Detalhes bibliográficos
Autor(a) principal:	Scavone, André Pasquale Rocco
Data de Publicação:	1996
Tipo de documento:	Dissertação
Idioma:	por
Título da fonte:	Biblioteca Digital de Teses e Dissertações da USP
Texto Completo:	https://www.teses.usp.br/teses/disponiveis/3/3142/tde-22082024-101705/
Resumo:	O uso de modelos ocultos de Markov (HMM) na tarefa de reconhecimento de voz tem sido objeto de extensa pesquisa. Esses modelos utilizam dois processos estatísticos inter-relacionados: enquanto um modelo a variabilidade dos ritmos de emissao, o outro representa a diversidade dos fenômenos acústicos da fala. Este segundo processo permitiria também absorver as características de diferentes vozes. Este trabalho estuda o uso dos modelos ocultos de Markov através da implementação de um sistema de reconhecimento de vocabulário restrito. O sistema utiliza a análise por coeficientes de predição linear e quantização vetorial para representar o sinal de voz por uma sequência de símbolos que estima os parâmetros dos modelos. Os resultados obtidos com um locutor confirmam a capacidade de representação desses modelos. No entanto, o desempenho do sistema se reduz consideravelmente quando aplicado a diversos locutores. Algumas alternativas são propostas no sentido de melhorar o desempenho do sistema, sem atingir grande exito. As soluções para a independência do locutor apontam para métodos adaptativos que preservem a versatilidade dos HMM.

Metadados do item

id	USP_2abd920d6d3186e396fb4c5fb6af0700
oai_identifier_str	oai:teses.usp.br:tde-22082024-101705
network_acronym_str	USP
network_name_str	Biblioteca Digital de Teses e Dissertações da USP
repository_id_str	2721
spelling	Reconhecimento de palavras por modelos ocultos de Markov.Untitled in englishReconhecimento de vozVoice recognitionO uso de modelos ocultos de Markov (HMM) na tarefa de reconhecimento de voz tem sido objeto de extensa pesquisa. Esses modelos utilizam dois processos estatísticos inter-relacionados: enquanto um modelo a variabilidade dos ritmos de emissao, o outro representa a diversidade dos fenômenos acústicos da fala. Este segundo processo permitiria também absorver as características de diferentes vozes. Este trabalho estuda o uso dos modelos ocultos de Markov através da implementação de um sistema de reconhecimento de vocabulário restrito. O sistema utiliza a análise por coeficientes de predição linear e quantização vetorial para representar o sinal de voz por uma sequência de símbolos que estima os parâmetros dos modelos. Os resultados obtidos com um locutor confirmam a capacidade de representação desses modelos. No entanto, o desempenho do sistema se reduz consideravelmente quando aplicado a diversos locutores. Algumas alternativas são propostas no sentido de melhorar o desempenho do sistema, sem atingir grande exito. As soluções para a independência do locutor apontam para métodos adaptativos que preservem a versatilidade dos HMM.The use of hidden Markov models (HMM) in autyomatic speech recognition has been object of extensive research. These models use two inter-related statistics processes, one modeling the variability of the utterances rythms while the other describes the diversity of speech accoustical phenomena. The later would also be able to manage the features of different individual voices. This work studies the use of hidden Markov models through a recognition system for a restricted vocabular. The system uses the linear coeficiente prediction analysis and vector quantization to represent the voice signal by sequences of symbols to estimate model parameters. The results achieved with a single speaker support the representation capability of these models. However, system performance drops significantly whrn applied to different speakers. Some alternatives are proposed to improve the system in this way, without achievieng better results. The solutions for speaker-independent tasks points to adaptative methods preserving HMM versatility.Biblioteca Digitais de Teses e Dissertações da USPCampos, Geraldo Lino deScavone, André Pasquale Rocco1996-05-31info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/3/3142/tde-22082024-101705/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2024-08-22T13:45:03Zoai:teses.usp.br:tde-22082024-101705Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br\|\| atendimento@aguia.usp.br\|\|virginia@if.usp.bropendoar:27212024-08-22T13:45:03Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv	Reconhecimento de palavras por modelos ocultos de Markov. Untitled in english
title	Reconhecimento de palavras por modelos ocultos de Markov.
spellingShingle	Reconhecimento de palavras por modelos ocultos de Markov. Scavone, André Pasquale Rocco Reconhecimento de voz Voice recognition
title_short	Reconhecimento de palavras por modelos ocultos de Markov.
title_full	Reconhecimento de palavras por modelos ocultos de Markov.
title_fullStr	Reconhecimento de palavras por modelos ocultos de Markov.
title_full_unstemmed	Reconhecimento de palavras por modelos ocultos de Markov.
title_sort	Reconhecimento de palavras por modelos ocultos de Markov.
author	Scavone, André Pasquale Rocco
author_facet	Scavone, André Pasquale Rocco
author_role	author
dc.contributor.none.fl_str_mv	Campos, Geraldo Lino de
dc.contributor.author.fl_str_mv	Scavone, André Pasquale Rocco
dc.subject.por.fl_str_mv	Reconhecimento de voz Voice recognition
topic	Reconhecimento de voz Voice recognition
description	O uso de modelos ocultos de Markov (HMM) na tarefa de reconhecimento de voz tem sido objeto de extensa pesquisa. Esses modelos utilizam dois processos estatísticos inter-relacionados: enquanto um modelo a variabilidade dos ritmos de emissao, o outro representa a diversidade dos fenômenos acústicos da fala. Este segundo processo permitiria também absorver as características de diferentes vozes. Este trabalho estuda o uso dos modelos ocultos de Markov através da implementação de um sistema de reconhecimento de vocabulário restrito. O sistema utiliza a análise por coeficientes de predição linear e quantização vetorial para representar o sinal de voz por uma sequência de símbolos que estima os parâmetros dos modelos. Os resultados obtidos com um locutor confirmam a capacidade de representação desses modelos. No entanto, o desempenho do sistema se reduz consideravelmente quando aplicado a diversos locutores. Algumas alternativas são propostas no sentido de melhorar o desempenho do sistema, sem atingir grande exito. As soluções para a independência do locutor apontam para métodos adaptativos que preservem a versatilidade dos HMM.
publishDate	1996
dc.date.none.fl_str_mv	1996-05-31
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	https://www.teses.usp.br/teses/disponiveis/3/3142/tde-22082024-101705/
url	https://www.teses.usp.br/teses/disponiveis/3/3142/tde-22082024-101705/
dc.language.iso.fl_str_mv	por
language	por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv	Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess
rights_invalid_str_mv	Liberar o conteúdo para acesso público.
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv	Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv	Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv	reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP
instname_str	Universidade de São Paulo (USP)
instacron_str	USP
institution	USP
reponame_str	Biblioteca Digital de Teses e Dissertações da USP
collection	Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv	Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv	virginia@if.usp.br\|\| atendimento@aguia.usp.br\|\|virginia@if.usp.br
_version_	1815257280189300736

Reconhecimento de palavras por modelos ocultos de Markov.

Registros relacionados