Sistema baseado em regras para o refinamento da segmentação automatica de fala
Autor(a) principal: | |
---|---|
Data de Publicação: | 2008 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
Texto Completo: | https://hdl.handle.net/20.500.12733/1607918 |
Resumo: | Orientador: Fabio Violaro |
id |
UNICAMP-30_0bbc1af68aabea4101bfd0279258e705 |
---|---|
oai_identifier_str |
oai::433164 |
network_acronym_str |
UNICAMP-30 |
network_name_str |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
repository_id_str |
|
spelling |
Sistema baseado em regras para o refinamento da segmentação automatica de falaRule based system for refining the automatic speech segmentationSistemas de processamento da falaFonética acústicaReconhecimento automático da vozProcessos de MarkovAutomatic speech segmentationAcoustic-phonetic featuresHMM modellingViterbi's algorithmRefining the automatic speech segmentationOrientador: Fabio ViolaroTese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de ComputaçãoResumo: A demanda por uma segmentação automática de fala confiável vem crescendo e exigindo pesquisas para suportar o desenvolvimento de sistemas que usam fala para uma interação homem-máquina. Neste contexto, este trabalho relata o desenvolvimento e avaliação de um sistema para segmentação automática de fala usando o algoritmo de Viterbi e refinamento das fronteiras de segmentação baseado nas características fonético-acústicas das classes fonéticas. As subunidades fonéticas (dependentes de contexto) são representadas com Modelos Ocultos de Markov (HMM - Hidden Markov Models). Cada fronteira estimada pelo algoritmo de Viterbi é refinada usando características acústicas dependentes de classes de fones, uma vez que a identidade dos fones do lado direito e esquerdo da fronteira considerada é conhecida. O sistema proposto foi avaliado usando duas bases dependentes de locutor do Português do Brasil (uma masculina e outra feminina) e também uma base independente de locutor (TIMIT). A avaliação foi realizada comparando a segmentação automática com a segmentação manual. Depois do processo de refinamento, um ganho de 29% nas fronteiras com erro de segmentação abaixo de 20 ms foi obtido para a base de fala dependente de locutor masculino do Português Brasileiro.Abstract: The demand for reliable automatic speech segmentation is increasing and requiring additional research to support the development of systems that use speech for man-machine interface. In this context, this work reports the development and evaluation of a system for automatic speech segmentation using Viterbi's algorithm and a refinement of segmentation boundaries based on acoustic-phonetic features. Phonetic sub-units (context-dependent phones) are modeled with HMM (Hidden Markov Models). Each boundary estimated by Viterbi's algorithm is refined using class-dependent acoustic features, as the identity of the phones on the left and right side of the considered boundary is known. The proposed system was evaluated using two speaker dependent Brazilian Portuguese speech databases (one male and one female speaker), and a speaker independent English database (TIMIT). The evaluation was carried out comparing automatic against manual segmentation. After the refinement process, an improvement of 29% in the percentage of segmentation errors below 20 ms was achieved for the male speaker dependent Brazilian Portuguese speech database.DoutoradoTelecomunicações e TelemáticaDoutor em Engenharia Elétrica[s.n.]Violaro, Fábio, 1950-Ynoguti, Carlos AlbertoKlautau, AldebaroBarbedo, Jaime Garcia ArnalBarbosa, Plinio AlmeidaUniversidade Estadual de Campinas (UNICAMP). Faculdade de Engenharia Elétrica e de ComputaçãoPrograma de Pós-Graduação em Engenharia ElétricaUNIVERSIDADE ESTADUAL DE CAMPINASSelmini, Antonio Marcos20082008-08-22T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdf191p. : il.https://hdl.handle.net/20.500.12733/1607918SELMINI, Antonio Marcos. Sistema baseado em regras para o refinamento da segmentação automatica de fala. 2008. 191p. Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1607918. Acesso em: 2 set. 2024.https://repositorio.unicamp.br/acervo/detalhe/433164porreponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)instname:Universidade Estadual de Campinas (UNICAMP)instacron:UNICAMPinfo:eu-repo/semantics/openAccess2017-02-18T05:19:07Zoai::433164Biblioteca Digital de Teses e DissertaçõesPUBhttp://repositorio.unicamp.br/oai/tese/oai.aspsbubd@unicamp.bropendoar:2017-02-18T05:19:07Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)false |
dc.title.none.fl_str_mv |
Sistema baseado em regras para o refinamento da segmentação automatica de fala Rule based system for refining the automatic speech segmentation |
title |
Sistema baseado em regras para o refinamento da segmentação automatica de fala |
spellingShingle |
Sistema baseado em regras para o refinamento da segmentação automatica de fala Selmini, Antonio Marcos Sistemas de processamento da fala Fonética acústica Reconhecimento automático da voz Processos de Markov Automatic speech segmentation Acoustic-phonetic features HMM modelling Viterbi's algorithm Refining the automatic speech segmentation |
title_short |
Sistema baseado em regras para o refinamento da segmentação automatica de fala |
title_full |
Sistema baseado em regras para o refinamento da segmentação automatica de fala |
title_fullStr |
Sistema baseado em regras para o refinamento da segmentação automatica de fala |
title_full_unstemmed |
Sistema baseado em regras para o refinamento da segmentação automatica de fala |
title_sort |
Sistema baseado em regras para o refinamento da segmentação automatica de fala |
author |
Selmini, Antonio Marcos |
author_facet |
Selmini, Antonio Marcos |
author_role |
author |
dc.contributor.none.fl_str_mv |
Violaro, Fábio, 1950- Ynoguti, Carlos Alberto Klautau, Aldebaro Barbedo, Jaime Garcia Arnal Barbosa, Plinio Almeida Universidade Estadual de Campinas (UNICAMP). Faculdade de Engenharia Elétrica e de Computação Programa de Pós-Graduação em Engenharia Elétrica UNIVERSIDADE ESTADUAL DE CAMPINAS |
dc.contributor.author.fl_str_mv |
Selmini, Antonio Marcos |
dc.subject.por.fl_str_mv |
Sistemas de processamento da fala Fonética acústica Reconhecimento automático da voz Processos de Markov Automatic speech segmentation Acoustic-phonetic features HMM modelling Viterbi's algorithm Refining the automatic speech segmentation |
topic |
Sistemas de processamento da fala Fonética acústica Reconhecimento automático da voz Processos de Markov Automatic speech segmentation Acoustic-phonetic features HMM modelling Viterbi's algorithm Refining the automatic speech segmentation |
description |
Orientador: Fabio Violaro |
publishDate |
2008 |
dc.date.none.fl_str_mv |
2008 2008-08-22T00:00:00Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://hdl.handle.net/20.500.12733/1607918 SELMINI, Antonio Marcos. Sistema baseado em regras para o refinamento da segmentação automatica de fala. 2008. 191p. Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1607918. Acesso em: 2 set. 2024. |
url |
https://hdl.handle.net/20.500.12733/1607918 |
identifier_str_mv |
SELMINI, Antonio Marcos. Sistema baseado em regras para o refinamento da segmentação automatica de fala. 2008. 191p. Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1607918. Acesso em: 2 set. 2024. |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
https://repositorio.unicamp.br/acervo/detalhe/433164 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf 191p. : il. |
dc.publisher.none.fl_str_mv |
[s.n.] |
publisher.none.fl_str_mv |
[s.n.] |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) instname:Universidade Estadual de Campinas (UNICAMP) instacron:UNICAMP |
instname_str |
Universidade Estadual de Campinas (UNICAMP) |
instacron_str |
UNICAMP |
institution |
UNICAMP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
collection |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP) |
repository.mail.fl_str_mv |
sbubd@unicamp.br |
_version_ |
1809188993430978560 |