Sistema baseado em regras para o refinamento da segmentação automatica de fala

Detalhes bibliográficos
Autor(a) principal: Selmini, Antonio Marcos
Data de Publicação: 2008
Tipo de documento: Tese
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
Texto Completo: https://hdl.handle.net/20.500.12733/1607918
Resumo: Orientador: Fabio Violaro
id UNICAMP-30_0bbc1af68aabea4101bfd0279258e705
oai_identifier_str oai::433164
network_acronym_str UNICAMP-30
network_name_str Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
repository_id_str
spelling Sistema baseado em regras para o refinamento da segmentação automatica de falaRule based system for refining the automatic speech segmentationSistemas de processamento da falaFonética acústicaReconhecimento automático da vozProcessos de MarkovAutomatic speech segmentationAcoustic-phonetic featuresHMM modellingViterbi's algorithmRefining the automatic speech segmentationOrientador: Fabio ViolaroTese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de ComputaçãoResumo: A demanda por uma segmentação automática de fala confiável vem crescendo e exigindo pesquisas para suportar o desenvolvimento de sistemas que usam fala para uma interação homem-máquina. Neste contexto, este trabalho relata o desenvolvimento e avaliação de um sistema para segmentação automática de fala usando o algoritmo de Viterbi e refinamento das fronteiras de segmentação baseado nas características fonético-acústicas das classes fonéticas. As subunidades fonéticas (dependentes de contexto) são representadas com Modelos Ocultos de Markov (HMM - Hidden Markov Models). Cada fronteira estimada pelo algoritmo de Viterbi é refinada usando características acústicas dependentes de classes de fones, uma vez que a identidade dos fones do lado direito e esquerdo da fronteira considerada é conhecida. O sistema proposto foi avaliado usando duas bases dependentes de locutor do Português do Brasil (uma masculina e outra feminina) e também uma base independente de locutor (TIMIT). A avaliação foi realizada comparando a segmentação automática com a segmentação manual. Depois do processo de refinamento, um ganho de 29% nas fronteiras com erro de segmentação abaixo de 20 ms foi obtido para a base de fala dependente de locutor masculino do Português Brasileiro.Abstract: The demand for reliable automatic speech segmentation is increasing and requiring additional research to support the development of systems that use speech for man-machine interface. In this context, this work reports the development and evaluation of a system for automatic speech segmentation using Viterbi's algorithm and a refinement of segmentation boundaries based on acoustic-phonetic features. Phonetic sub-units (context-dependent phones) are modeled with HMM (Hidden Markov Models). Each boundary estimated by Viterbi's algorithm is refined using class-dependent acoustic features, as the identity of the phones on the left and right side of the considered boundary is known. The proposed system was evaluated using two speaker dependent Brazilian Portuguese speech databases (one male and one female speaker), and a speaker independent English database (TIMIT). The evaluation was carried out comparing automatic against manual segmentation. After the refinement process, an improvement of 29% in the percentage of segmentation errors below 20 ms was achieved for the male speaker dependent Brazilian Portuguese speech database.DoutoradoTelecomunicações e TelemáticaDoutor em Engenharia Elétrica[s.n.]Violaro, Fábio, 1950-Ynoguti, Carlos AlbertoKlautau, AldebaroBarbedo, Jaime Garcia ArnalBarbosa, Plinio AlmeidaUniversidade Estadual de Campinas (UNICAMP). Faculdade de Engenharia Elétrica e de ComputaçãoPrograma de Pós-Graduação em Engenharia ElétricaUNIVERSIDADE ESTADUAL DE CAMPINASSelmini, Antonio Marcos20082008-08-22T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdf191p. : il.https://hdl.handle.net/20.500.12733/1607918SELMINI, Antonio Marcos. Sistema baseado em regras para o refinamento da segmentação automatica de fala. 2008. 191p. Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1607918. Acesso em: 2 set. 2024.https://repositorio.unicamp.br/acervo/detalhe/433164porreponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)instname:Universidade Estadual de Campinas (UNICAMP)instacron:UNICAMPinfo:eu-repo/semantics/openAccess2017-02-18T05:19:07Zoai::433164Biblioteca Digital de Teses e DissertaçõesPUBhttp://repositorio.unicamp.br/oai/tese/oai.aspsbubd@unicamp.bropendoar:2017-02-18T05:19:07Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)false
dc.title.none.fl_str_mv Sistema baseado em regras para o refinamento da segmentação automatica de fala
Rule based system for refining the automatic speech segmentation
title Sistema baseado em regras para o refinamento da segmentação automatica de fala
spellingShingle Sistema baseado em regras para o refinamento da segmentação automatica de fala
Selmini, Antonio Marcos
Sistemas de processamento da fala
Fonética acústica
Reconhecimento automático da voz
Processos de Markov
Automatic speech segmentation
Acoustic-phonetic features
HMM modelling
Viterbi's algorithm
Refining the automatic speech segmentation
title_short Sistema baseado em regras para o refinamento da segmentação automatica de fala
title_full Sistema baseado em regras para o refinamento da segmentação automatica de fala
title_fullStr Sistema baseado em regras para o refinamento da segmentação automatica de fala
title_full_unstemmed Sistema baseado em regras para o refinamento da segmentação automatica de fala
title_sort Sistema baseado em regras para o refinamento da segmentação automatica de fala
author Selmini, Antonio Marcos
author_facet Selmini, Antonio Marcos
author_role author
dc.contributor.none.fl_str_mv Violaro, Fábio, 1950-
Ynoguti, Carlos Alberto
Klautau, Aldebaro
Barbedo, Jaime Garcia Arnal
Barbosa, Plinio Almeida
Universidade Estadual de Campinas (UNICAMP). Faculdade de Engenharia Elétrica e de Computação
Programa de Pós-Graduação em Engenharia Elétrica
UNIVERSIDADE ESTADUAL DE CAMPINAS
dc.contributor.author.fl_str_mv Selmini, Antonio Marcos
dc.subject.por.fl_str_mv Sistemas de processamento da fala
Fonética acústica
Reconhecimento automático da voz
Processos de Markov
Automatic speech segmentation
Acoustic-phonetic features
HMM modelling
Viterbi's algorithm
Refining the automatic speech segmentation
topic Sistemas de processamento da fala
Fonética acústica
Reconhecimento automático da voz
Processos de Markov
Automatic speech segmentation
Acoustic-phonetic features
HMM modelling
Viterbi's algorithm
Refining the automatic speech segmentation
description Orientador: Fabio Violaro
publishDate 2008
dc.date.none.fl_str_mv 2008
2008-08-22T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://hdl.handle.net/20.500.12733/1607918
SELMINI, Antonio Marcos. Sistema baseado em regras para o refinamento da segmentação automatica de fala. 2008. 191p. Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1607918. Acesso em: 2 set. 2024.
url https://hdl.handle.net/20.500.12733/1607918
identifier_str_mv SELMINI, Antonio Marcos. Sistema baseado em regras para o refinamento da segmentação automatica de fala. 2008. 191p. Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1607918. Acesso em: 2 set. 2024.
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv https://repositorio.unicamp.br/acervo/detalhe/433164
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
191p. : il.
dc.publisher.none.fl_str_mv [s.n.]
publisher.none.fl_str_mv [s.n.]
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
instname:Universidade Estadual de Campinas (UNICAMP)
instacron:UNICAMP
instname_str Universidade Estadual de Campinas (UNICAMP)
instacron_str UNICAMP
institution UNICAMP
reponame_str Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
collection Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)
repository.mail.fl_str_mv sbubd@unicamp.br
_version_ 1809188993430978560