Sintese e reconhecimento da fala humana
Autor(a) principal: | |
---|---|
Data de Publicação: | 2006 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
Texto Completo: | https://hdl.handle.net/20.500.12733/1603780 |
Resumo: | Orientadores: Fabio Violaro, Anamaria Gomide |
id |
UNICAMP-30_71f67d1c41479f197650ae744192f865 |
---|---|
oai_identifier_str |
oai::385673 |
network_acronym_str |
UNICAMP-30 |
network_name_str |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
repository_id_str |
|
spelling |
Sintese e reconhecimento da fala humanaSynthesis and recognition of human speechSistemas de processamento da falaProcessamento de sinaisReconhecimento automático da vozSíntese da vozReconhecimento automatico da falaSpeech processing systemsSignal processingAutomatic speech recognitionVoice systhesisOrientadores: Fabio Violaro, Anamaria GomideDissertação (mestrado profissional) - Universidade Estadual de Campinas, Instituto de ComputaçãoResumo: O objetivo deste trabalho é apresentar uma revisão dos principais conceitos e métodos envolvidos na síntese, processamento e reconhecimento da fala humana por computador.Estas tecnologias têm inúmeras aplicações, que têm aumentado substancialmente nos últimos anos com a popularização de equipamentos de comunicação portáteis (celulares, laptops, palmtops) e a universalização da Internet. A primeira parte deste trabalho é uma revisão dos conceitos básicos de processamento de sinais, incluindo transformada de Fourier, espectro de potência e espectrograma, filtros, digitalização de sinais e o teorema de Nyquist. A segunda parte descreve as principais características da fala humana, os mecanismos envolvidos em sua produção e percepção, e o conceito de fone (unidade lingüística de som). Nessa parte também descrevemos brevemente as principais técnicas para a conversão ortográfica-fonética, para a síntese de fala a partir da descrição fonética, e para o reconhecimento da fala natural. A terceira parte descreve um projeto prático que desenvolvemos para consolidar os conhecimentos adquiridos neste mestrado: um programa que gera canções populares japonesas a partir de uma descrição textual da letra de música, usando método de síntese concatenativa. No final do trabalho listamos também alguns softwares disponíveis (livres e comerciais) para síntese e reconhecimento da falaAbstract: The goal of this dissertation is to review the main concepts relating to the synthesis, processing, and recognition of human speech by computer. These technologies have many applications, which have increased substantially in recent years after the spread of portable communication equipment (mobile phones, laptops, palmtops) and the universal access to the Internet. The first part of this work is a revision of fundamental concepts of signal processing, including the Fourier transform, power spectrum and spectrogram, filters, signal digitalization, and Nyquist's theorem. The second part describes the main characteristics of human speech, the mechanisms involved in its production and perception, and the concept of phone (linguistic unit of sound). In this part we also briefly describe the main techniques used for orthographic-phonetic transcription, for speech synthesis from a phonetic description, and for the recognition of natural speech. The third part describes a practical project we developed to consolidate the knowledge acquired in our Masters studies: a program that generates Japanese popular songs from a textual description of the lyrics and music, using the concatenative synthesis method. At the end of this dissertation, we list some available software products (free and commercial) for speech synthesis and speech recognitionMestradoEngenharia de ComputaçãoMestre em Ciência da Computação[s.n.]Violaro, Fábio, 1950-Gomide, Anamaria, 1949-Ynoguti, Carlos AlbertoLeite, Neucimar JerônimoUniversidade Estadual de Campinas (UNICAMP). Instituto de ComputaçãoPrograma de Pós-Graduação em Ciência da ComputaçãoUNIVERSIDADE ESTADUAL DE CAMPINASStolfi, Rumiko Oishi20062006-10-31T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdf151p. : il.(Broch.)https://hdl.handle.net/20.500.12733/1603780STOLFI, Rumiko Oishi. Sintese e reconhecimento da fala humana. 2006. 151p. Dissertação (mestrado profissional) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1603780. Acesso em: 2 set. 2024.https://repositorio.unicamp.br/acervo/detalhe/385673porreponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)instname:Universidade Estadual de Campinas (UNICAMP)instacron:UNICAMPinfo:eu-repo/semantics/openAccess2017-02-18T04:42:26Zoai::385673Biblioteca Digital de Teses e DissertaçõesPUBhttp://repositorio.unicamp.br/oai/tese/oai.aspsbubd@unicamp.bropendoar:2017-02-18T04:42:26Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)false |
dc.title.none.fl_str_mv |
Sintese e reconhecimento da fala humana Synthesis and recognition of human speech |
title |
Sintese e reconhecimento da fala humana |
spellingShingle |
Sintese e reconhecimento da fala humana Stolfi, Rumiko Oishi Sistemas de processamento da fala Processamento de sinais Reconhecimento automático da voz Síntese da voz Reconhecimento automatico da fala Speech processing systems Signal processing Automatic speech recognition Voice systhesis |
title_short |
Sintese e reconhecimento da fala humana |
title_full |
Sintese e reconhecimento da fala humana |
title_fullStr |
Sintese e reconhecimento da fala humana |
title_full_unstemmed |
Sintese e reconhecimento da fala humana |
title_sort |
Sintese e reconhecimento da fala humana |
author |
Stolfi, Rumiko Oishi |
author_facet |
Stolfi, Rumiko Oishi |
author_role |
author |
dc.contributor.none.fl_str_mv |
Violaro, Fábio, 1950- Gomide, Anamaria, 1949- Ynoguti, Carlos Alberto Leite, Neucimar Jerônimo Universidade Estadual de Campinas (UNICAMP). Instituto de Computação Programa de Pós-Graduação em Ciência da Computação UNIVERSIDADE ESTADUAL DE CAMPINAS |
dc.contributor.author.fl_str_mv |
Stolfi, Rumiko Oishi |
dc.subject.por.fl_str_mv |
Sistemas de processamento da fala Processamento de sinais Reconhecimento automático da voz Síntese da voz Reconhecimento automatico da fala Speech processing systems Signal processing Automatic speech recognition Voice systhesis |
topic |
Sistemas de processamento da fala Processamento de sinais Reconhecimento automático da voz Síntese da voz Reconhecimento automatico da fala Speech processing systems Signal processing Automatic speech recognition Voice systhesis |
description |
Orientadores: Fabio Violaro, Anamaria Gomide |
publishDate |
2006 |
dc.date.none.fl_str_mv |
2006 2006-10-31T00:00:00Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
(Broch.) https://hdl.handle.net/20.500.12733/1603780 STOLFI, Rumiko Oishi. Sintese e reconhecimento da fala humana. 2006. 151p. Dissertação (mestrado profissional) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1603780. Acesso em: 2 set. 2024. |
identifier_str_mv |
(Broch.) STOLFI, Rumiko Oishi. Sintese e reconhecimento da fala humana. 2006. 151p. Dissertação (mestrado profissional) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1603780. Acesso em: 2 set. 2024. |
url |
https://hdl.handle.net/20.500.12733/1603780 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
https://repositorio.unicamp.br/acervo/detalhe/385673 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf 151p. : il. |
dc.publisher.none.fl_str_mv |
[s.n.] |
publisher.none.fl_str_mv |
[s.n.] |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) instname:Universidade Estadual de Campinas (UNICAMP) instacron:UNICAMP |
instname_str |
Universidade Estadual de Campinas (UNICAMP) |
instacron_str |
UNICAMP |
institution |
UNICAMP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
collection |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP) |
repository.mail.fl_str_mv |
sbubd@unicamp.br |
_version_ |
1809188954968162304 |