Estudo de um sistema de conversão texto-fala baseado em HMM
Autor(a) principal: | |
---|---|
Data de Publicação: | 2013 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
Texto Completo: | https://hdl.handle.net/20.500.12733/1619956 |
Resumo: | Orientador: Fábio Violaro |
id |
UNICAMP-30_cf1c58fef261e81bb1baffc64e20110a |
---|---|
oai_identifier_str |
oai::905084 |
network_acronym_str |
UNICAMP-30 |
network_name_str |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
repository_id_str |
|
spelling |
Estudo de um sistema de conversão texto-fala baseado em HMMStudy of a HMM-based text-to-speech systemSíntese da vozSistemas de processamento da falaVoice synthesisHidden Markov models (HMM)Speech processing systemsOrientador: Fábio ViolaroDissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Elétrica e de ComputaçãoResumo: Com o contínuo desenvolvimento da tecnologia, há uma demanda crescente por sistemas de síntese de fala que sejam capazes de falar como humanos, para integrá-los nas mais diversas aplicações, seja no âmbito da automação robótica, sejam para acessibilidade de pessoas com deficiências, seja em aplicativos destinados a cultura e lazer. A síntese de fala baseada em modelos ocultos de Markov (HMM) mostra-se promissora em suprir esta necessidade tecnológica. A sua natureza estatística e paramétrica a tornam um sistema flexível, capaz de adaptar vozes artificiais, inserir emoções no discurso e obter fala sintética de boa qualidade usando uma base de treinamento limitada. Esta dissertação apresenta o estudo realizado sobre o sistema de síntese de fala baseado em HMM (HTS), descrevendo as etapas que envolvem o treinamento dos modelos HMMs e a geração do sinal de fala. São apresentados os modelos espectrais, de pitch e de duração que constituem estes modelos HMM dos fonemas dependentes de contexto, considerando as diversas técnicas de estruturação deles. Alguns dos problemas encontrados no HTS, tais como a característica abafada e monótona da fala artificial, são analisados juntamente com algumas técnicas propostas para aprimorar a qualidade final do sinal de fala sintetizadoAbstract: With the continuous development of technology, there is a growing demand for text-to-speech systems that are able to speak like humans, in order to integrate them in the most diverse applications whether in the field of automation and robotics, or for accessibility of people with disabilities, as for culture and leisure activities. Speech synthesis based on hidden Markov models (HMM) shows to be promising in addressing this need. Their statistical and parametric nature make it a flexible system capable of adapting artificial voices, insert emotions in speech and get artificial speech of good quality using a limited amount of speech data for HMM training. This thesis presents the study realized on HMM-based speech synthesis system (HTS), describing the steps that involve the training of HMM models and the artificial speech generation. Spectral, pitch and duration models are presented, which form context-dependent HMM models, and also are considered the various techniques for structuring them. Some of the problems encountered in the HTS, such as the characteristic muffled and monotone of artificial speech, are analyzed along with some of the proposed techniques to improve the final quality of the synthesized speech signalMestradoTelecomunicações e TelemáticaMestra em Engenharia Elétrica[s.n.]Violaro, Fábio, 1950-Ynoguti, Carlos AlbertoLopes, Renato da RochaUniversidade Estadual de Campinas (UNICAMP). Faculdade de Engenharia Elétrica e de ComputaçãoPrograma de Pós-Graduação em Engenharia ElétricaUNIVERSIDADE ESTADUAL DE CAMPINASCarvalho, Sarah Negreiros de, 1985-2013info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdf94 p. : il.https://hdl.handle.net/20.500.12733/1619956CARVALHO, Sarah Negreiros de. Estudo de um sistema de conversão texto-fala baseado em HMM. 2013. 94 p. Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Elétrica e de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1619956. Acesso em: 28 fev. 2025.https://repositorio.unicamp.br/acervo/detalhe/905084porreponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)instname:Universidade Estadual de Campinas (UNICAMP)instacron:UNICAMPinfo:eu-repo/semantics/openAccess2017-02-18T06:56:21Zoai::905084Biblioteca Digital de Teses e DissertaçõesPUBhttp://repositorio.unicamp.br/oai/tese/oai.aspsbubd@unicamp.bropendoar:2017-02-18T06:56:21Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)false |
dc.title.none.fl_str_mv |
Estudo de um sistema de conversão texto-fala baseado em HMM Study of a HMM-based text-to-speech system |
title |
Estudo de um sistema de conversão texto-fala baseado em HMM |
spellingShingle |
Estudo de um sistema de conversão texto-fala baseado em HMM Carvalho, Sarah Negreiros de, 1985- Síntese da voz Sistemas de processamento da fala Voice synthesis Hidden Markov models (HMM) Speech processing systems |
title_short |
Estudo de um sistema de conversão texto-fala baseado em HMM |
title_full |
Estudo de um sistema de conversão texto-fala baseado em HMM |
title_fullStr |
Estudo de um sistema de conversão texto-fala baseado em HMM |
title_full_unstemmed |
Estudo de um sistema de conversão texto-fala baseado em HMM |
title_sort |
Estudo de um sistema de conversão texto-fala baseado em HMM |
author |
Carvalho, Sarah Negreiros de, 1985- |
author_facet |
Carvalho, Sarah Negreiros de, 1985- |
author_role |
author |
dc.contributor.none.fl_str_mv |
Violaro, Fábio, 1950- Ynoguti, Carlos Alberto Lopes, Renato da Rocha Universidade Estadual de Campinas (UNICAMP). Faculdade de Engenharia Elétrica e de Computação Programa de Pós-Graduação em Engenharia Elétrica UNIVERSIDADE ESTADUAL DE CAMPINAS |
dc.contributor.author.fl_str_mv |
Carvalho, Sarah Negreiros de, 1985- |
dc.subject.por.fl_str_mv |
Síntese da voz Sistemas de processamento da fala Voice synthesis Hidden Markov models (HMM) Speech processing systems |
topic |
Síntese da voz Sistemas de processamento da fala Voice synthesis Hidden Markov models (HMM) Speech processing systems |
description |
Orientador: Fábio Violaro |
publishDate |
2013 |
dc.date.none.fl_str_mv |
2013 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://hdl.handle.net/20.500.12733/1619956 CARVALHO, Sarah Negreiros de. Estudo de um sistema de conversão texto-fala baseado em HMM. 2013. 94 p. Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Elétrica e de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1619956. Acesso em: 28 fev. 2025. |
url |
https://hdl.handle.net/20.500.12733/1619956 |
identifier_str_mv |
CARVALHO, Sarah Negreiros de. Estudo de um sistema de conversão texto-fala baseado em HMM. 2013. 94 p. Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Elétrica e de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1619956. Acesso em: 28 fev. 2025. |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
https://repositorio.unicamp.br/acervo/detalhe/905084 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf 94 p. : il. |
dc.publisher.none.fl_str_mv |
[s.n.] |
publisher.none.fl_str_mv |
[s.n.] |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) instname:Universidade Estadual de Campinas (UNICAMP) instacron:UNICAMP |
instname_str |
Universidade Estadual de Campinas (UNICAMP) |
instacron_str |
UNICAMP |
institution |
UNICAMP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
collection |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP) |
repository.mail.fl_str_mv |
sbubd@unicamp.br |
_version_ |
1825951758166261760 |