Reconhecimento de fala utilizando modelos de Markov escondidos (HMM's) de densidades contínuas.
Autor(a) principal: | |
---|---|
Data de Publicação: | 1994 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da UFCG |
Texto Completo: | http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/2500 |
Resumo: | Nesta dissertação é realizado um estudo teórico e a implementação em software de um sistema de reconhecimento de fala baseado em Modelos de Markov Escondidos (Hidden Markov Models - HMM's). HMM é uma ferramenta matemática que possibilita um modelamento dos sons da fala em termos de uma estrutura probabilística. Para tanto, utiliza-se, neste trabalho, HMM's do tipo left-right de cinco estados e fdp's contínuas, para representar a probabilidade dos vetores de observações em cada estado da cadeia de Markov. Os vetores de observações, de dimensão nove, são formados por oito coeficientes cepstrais e o logaritmo da energia segmentai como o nono parâmetro. O sistema H MM é composto de duas etapas: treinamento e classificação. Na fase de treinamento, o algoritmo de Baum-Welch é utilizado para reestimar os valores finais dos modelos. Por outro lado, na fase de classificação, utiliza-se o algoritmo de Viterbi para fornecer o valor da máxima verossimilhança entre a sentença de teste e os HMM's de referência. A avaliação do sistema proposto é realizada considerando-se dois diferentes modos de reconhecimento: o reconhecimento independente do locutor e o reconhecimento dependente do locutor. Em ambos os casos, especialmente para o modo de reconhecimento dependente do locutor, as avaliações realizadas levam a resultados bastante satisfatórios, considerando-se as condições gerais de experimentação. Além disso, várias conclusões importantes são obtidas para uma posterior otimização do sistema proposto. Finalmente, espera-se que este trabalho contribua de forma positiva para a motivação de novos estudos no campo da comunicação vocal homem-máquina. |
id |
UFCG_20bff62d9bdfadb727c84dcff30dbcde |
---|---|
oai_identifier_str |
oai:localhost:riufcg/2500 |
network_acronym_str |
UFCG |
network_name_str |
Biblioteca Digital de Teses e Dissertações da UFCG |
repository_id_str |
4851 |
spelling |
Reconhecimento de fala utilizando modelos de Markov escondidos (HMM's) de densidades contínuas.Speech recognition using hidden Markov models (HMM's) of continuous densities.Processamento Digital de VozReconhecimento de VozFala - ReconhecimentoDensidades ContínuasFala Contínua - ReconhecimentoModelos de Markov Escondidos - HMM'SSistema de Reconhecimento de FalaModelagem da VozModelagem ComputacionalHMM's - Cinco Estados e FDP's ContínuasCoeficientes CepstraisLogaritmo da Energia SegmentalAlgoritmo de Baum-WelchAlgoritmo de ViterbiReconhecimento Independente do LocutorReconhecimento Dependente do LocutorVoice ModelingProcessamento de Sinais de VozVoice RecognitionSpeech Recognition SystemProcessing of Voice SignalsCiência da Computação.Nesta dissertação é realizado um estudo teórico e a implementação em software de um sistema de reconhecimento de fala baseado em Modelos de Markov Escondidos (Hidden Markov Models - HMM's). HMM é uma ferramenta matemática que possibilita um modelamento dos sons da fala em termos de uma estrutura probabilística. Para tanto, utiliza-se, neste trabalho, HMM's do tipo left-right de cinco estados e fdp's contínuas, para representar a probabilidade dos vetores de observações em cada estado da cadeia de Markov. Os vetores de observações, de dimensão nove, são formados por oito coeficientes cepstrais e o logaritmo da energia segmentai como o nono parâmetro. O sistema H MM é composto de duas etapas: treinamento e classificação. Na fase de treinamento, o algoritmo de Baum-Welch é utilizado para reestimar os valores finais dos modelos. Por outro lado, na fase de classificação, utiliza-se o algoritmo de Viterbi para fornecer o valor da máxima verossimilhança entre a sentença de teste e os HMM's de referência. A avaliação do sistema proposto é realizada considerando-se dois diferentes modos de reconhecimento: o reconhecimento independente do locutor e o reconhecimento dependente do locutor. Em ambos os casos, especialmente para o modo de reconhecimento dependente do locutor, as avaliações realizadas levam a resultados bastante satisfatórios, considerando-se as condições gerais de experimentação. Além disso, várias conclusões importantes são obtidas para uma posterior otimização do sistema proposto. Finalmente, espera-se que este trabalho contribua de forma positiva para a motivação de novos estudos no campo da comunicação vocal homem-máquina.This dissertation presents a theoretical study and the software implementation of a speech recognition system, based on Hidden Markov Models (HMM's). HMM is a mathematical tool that makes it possible modeling of the speech sounds in terms of a probabilistic structure. In order to do this, use is made in this work of HMM's of the left-right type with five states and continuous fdp's, to represent the observation vectors probability on each state of the Markov chain. The observation vectors, which are nine-dimensional, are formed by eight cepstral coefficients and the logarithm of the segmentai energy as the nineth parameter. The HMM system is divided into two stages: training and classification. In the training stage, the Baum-Welch algorithm is used to reestimate the final values of the models. On the other hand, the classification stage makes use of the Viterbi algorithm to provide the maximum-likelihood value between the test sentence and the reference HMM's. The evaluation of the proposed system is made considering two different types of voice recognition: the independent speaker recognition and the dependent speaker recognition. In both cases, specially on the speaker dependent mode, the avaluation made given results really satisfactory, account to experimenting general conditions. In addition, some important conclusions are obtained in order to provide a posterior optimization on the proposed system. Finally, i t is expected that this work contributes in a positive way for the motivation of new studies on man-machine voice communication.Universidade Federal de Campina GrandeBrasilCentro de Engenharia Elétrica e Informática - CEEIPÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICAUFCGAGUIAR NETO, Benedito Guimarães.http://lattes.cnpq.br/3405447548131544BRASILEIRO, Marcos Antônio Gonçalves.http://lattes.cnpq.br/5116018735357851PEQUENO, Mauro Cavalcante.http://lattes.cnpq.br/0649693969807037ALENCAR, Marcelo Sampaio de.http://lattes.cnpq.br/0946722048975388COSTA, Washington César de Almeida.1994-06-202019-01-11T12:35:16Z2019-01-112019-01-11T12:35:16Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttp://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/2500COSTA, W. C. de A. Reconhecimento de fala utilizando modelos de Markov escondidos (HMM's) de densidades contínuas. 103 f. 1994. (Dissertação de Mestrado em Engenharia Elétrica), Programa de Pós-graduação em Engenharia Elétrica, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande - Paraíba - Brasil, 1994.porinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFCGinstname:Universidade Federal de Campina Grande (UFCG)instacron:UFCG2021-06-08T17:42:19Zoai:localhost:riufcg/2500Biblioteca Digital de Teses e Dissertaçõeshttp://bdtd.ufcg.edu.br/PUBhttp://dspace.sti.ufcg.edu.br:8080/oai/requestbdtd@setor.ufcg.edu.br || bdtd@setor.ufcg.edu.bropendoar:48512021-06-08T17:42:19Biblioteca Digital de Teses e Dissertações da UFCG - Universidade Federal de Campina Grande (UFCG)false |
dc.title.none.fl_str_mv |
Reconhecimento de fala utilizando modelos de Markov escondidos (HMM's) de densidades contínuas. Speech recognition using hidden Markov models (HMM's) of continuous densities. |
title |
Reconhecimento de fala utilizando modelos de Markov escondidos (HMM's) de densidades contínuas. |
spellingShingle |
Reconhecimento de fala utilizando modelos de Markov escondidos (HMM's) de densidades contínuas. COSTA, Washington César de Almeida. Processamento Digital de Voz Reconhecimento de Voz Fala - Reconhecimento Densidades Contínuas Fala Contínua - Reconhecimento Modelos de Markov Escondidos - HMM'S Sistema de Reconhecimento de Fala Modelagem da Voz Modelagem Computacional HMM's - Cinco Estados e FDP's Contínuas Coeficientes Cepstrais Logaritmo da Energia Segmental Algoritmo de Baum-Welch Algoritmo de Viterbi Reconhecimento Independente do Locutor Reconhecimento Dependente do Locutor Voice Modeling Processamento de Sinais de Voz Voice Recognition Speech Recognition System Processing of Voice Signals Ciência da Computação. |
title_short |
Reconhecimento de fala utilizando modelos de Markov escondidos (HMM's) de densidades contínuas. |
title_full |
Reconhecimento de fala utilizando modelos de Markov escondidos (HMM's) de densidades contínuas. |
title_fullStr |
Reconhecimento de fala utilizando modelos de Markov escondidos (HMM's) de densidades contínuas. |
title_full_unstemmed |
Reconhecimento de fala utilizando modelos de Markov escondidos (HMM's) de densidades contínuas. |
title_sort |
Reconhecimento de fala utilizando modelos de Markov escondidos (HMM's) de densidades contínuas. |
author |
COSTA, Washington César de Almeida. |
author_facet |
COSTA, Washington César de Almeida. |
author_role |
author |
dc.contributor.none.fl_str_mv |
AGUIAR NETO, Benedito Guimarães. http://lattes.cnpq.br/3405447548131544 BRASILEIRO, Marcos Antônio Gonçalves. http://lattes.cnpq.br/5116018735357851 PEQUENO, Mauro Cavalcante. http://lattes.cnpq.br/0649693969807037 ALENCAR, Marcelo Sampaio de. http://lattes.cnpq.br/0946722048975388 |
dc.contributor.author.fl_str_mv |
COSTA, Washington César de Almeida. |
dc.subject.por.fl_str_mv |
Processamento Digital de Voz Reconhecimento de Voz Fala - Reconhecimento Densidades Contínuas Fala Contínua - Reconhecimento Modelos de Markov Escondidos - HMM'S Sistema de Reconhecimento de Fala Modelagem da Voz Modelagem Computacional HMM's - Cinco Estados e FDP's Contínuas Coeficientes Cepstrais Logaritmo da Energia Segmental Algoritmo de Baum-Welch Algoritmo de Viterbi Reconhecimento Independente do Locutor Reconhecimento Dependente do Locutor Voice Modeling Processamento de Sinais de Voz Voice Recognition Speech Recognition System Processing of Voice Signals Ciência da Computação. |
topic |
Processamento Digital de Voz Reconhecimento de Voz Fala - Reconhecimento Densidades Contínuas Fala Contínua - Reconhecimento Modelos de Markov Escondidos - HMM'S Sistema de Reconhecimento de Fala Modelagem da Voz Modelagem Computacional HMM's - Cinco Estados e FDP's Contínuas Coeficientes Cepstrais Logaritmo da Energia Segmental Algoritmo de Baum-Welch Algoritmo de Viterbi Reconhecimento Independente do Locutor Reconhecimento Dependente do Locutor Voice Modeling Processamento de Sinais de Voz Voice Recognition Speech Recognition System Processing of Voice Signals Ciência da Computação. |
description |
Nesta dissertação é realizado um estudo teórico e a implementação em software de um sistema de reconhecimento de fala baseado em Modelos de Markov Escondidos (Hidden Markov Models - HMM's). HMM é uma ferramenta matemática que possibilita um modelamento dos sons da fala em termos de uma estrutura probabilística. Para tanto, utiliza-se, neste trabalho, HMM's do tipo left-right de cinco estados e fdp's contínuas, para representar a probabilidade dos vetores de observações em cada estado da cadeia de Markov. Os vetores de observações, de dimensão nove, são formados por oito coeficientes cepstrais e o logaritmo da energia segmentai como o nono parâmetro. O sistema H MM é composto de duas etapas: treinamento e classificação. Na fase de treinamento, o algoritmo de Baum-Welch é utilizado para reestimar os valores finais dos modelos. Por outro lado, na fase de classificação, utiliza-se o algoritmo de Viterbi para fornecer o valor da máxima verossimilhança entre a sentença de teste e os HMM's de referência. A avaliação do sistema proposto é realizada considerando-se dois diferentes modos de reconhecimento: o reconhecimento independente do locutor e o reconhecimento dependente do locutor. Em ambos os casos, especialmente para o modo de reconhecimento dependente do locutor, as avaliações realizadas levam a resultados bastante satisfatórios, considerando-se as condições gerais de experimentação. Além disso, várias conclusões importantes são obtidas para uma posterior otimização do sistema proposto. Finalmente, espera-se que este trabalho contribua de forma positiva para a motivação de novos estudos no campo da comunicação vocal homem-máquina. |
publishDate |
1994 |
dc.date.none.fl_str_mv |
1994-06-20 2019-01-11T12:35:16Z 2019-01-11 2019-01-11T12:35:16Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/2500 COSTA, W. C. de A. Reconhecimento de fala utilizando modelos de Markov escondidos (HMM's) de densidades contínuas. 103 f. 1994. (Dissertação de Mestrado em Engenharia Elétrica), Programa de Pós-graduação em Engenharia Elétrica, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande - Paraíba - Brasil, 1994. |
url |
http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/2500 |
identifier_str_mv |
COSTA, W. C. de A. Reconhecimento de fala utilizando modelos de Markov escondidos (HMM's) de densidades contínuas. 103 f. 1994. (Dissertação de Mestrado em Engenharia Elétrica), Programa de Pós-graduação em Engenharia Elétrica, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande - Paraíba - Brasil, 1994. |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Campina Grande Brasil Centro de Engenharia Elétrica e Informática - CEEI PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA UFCG |
publisher.none.fl_str_mv |
Universidade Federal de Campina Grande Brasil Centro de Engenharia Elétrica e Informática - CEEI PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA UFCG |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UFCG instname:Universidade Federal de Campina Grande (UFCG) instacron:UFCG |
instname_str |
Universidade Federal de Campina Grande (UFCG) |
instacron_str |
UFCG |
institution |
UFCG |
reponame_str |
Biblioteca Digital de Teses e Dissertações da UFCG |
collection |
Biblioteca Digital de Teses e Dissertações da UFCG |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UFCG - Universidade Federal de Campina Grande (UFCG) |
repository.mail.fl_str_mv |
bdtd@setor.ufcg.edu.br || bdtd@setor.ufcg.edu.br |
_version_ |
1809744364510904320 |