Sistema baseado em regras para o refinamento da segmentação automatica de fala

Selmini, Antonio Marcos

Sistema baseado em regras para o refinamento da segmentação automatica de fala

Detalhes bibliográficos
Autor(a) principal:	Selmini, Antonio Marcos
Data de Publicação:	2008
Tipo de documento:	Tese
Idioma:	por
Título da fonte:	Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
Texto Completo:	https://hdl.handle.net/20.500.12733/1607918
Resumo:	Orientador: Fabio Violaro

Metadados do item

id	UNICAMP-30_0bbc1af68aabea4101bfd0279258e705
oai_identifier_str	oai::433164
network_acronym_str	UNICAMP-30
network_name_str	Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
repository_id_str
spelling	Sistema baseado em regras para o refinamento da segmentação automatica de falaRule based system for refining the automatic speech segmentationSistemas de processamento da falaFonética acústicaReconhecimento automático da vozProcessos de MarkovAutomatic speech segmentationAcoustic-phonetic featuresHMM modellingViterbi's algorithmRefining the automatic speech segmentationOrientador: Fabio ViolaroTese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de ComputaçãoResumo: A demanda por uma segmentação automática de fala confiável vem crescendo e exigindo pesquisas para suportar o desenvolvimento de sistemas que usam fala para uma interação homem-máquina. Neste contexto, este trabalho relata o desenvolvimento e avaliação de um sistema para segmentação automática de fala usando o algoritmo de Viterbi e refinamento das fronteiras de segmentação baseado nas características fonético-acústicas das classes fonéticas. As subunidades fonéticas (dependentes de contexto) são representadas com Modelos Ocultos de Markov (HMM - Hidden Markov Models). Cada fronteira estimada pelo algoritmo de Viterbi é refinada usando características acústicas dependentes de classes de fones, uma vez que a identidade dos fones do lado direito e esquerdo da fronteira considerada é conhecida. O sistema proposto foi avaliado usando duas bases dependentes de locutor do Português do Brasil (uma masculina e outra feminina) e também uma base independente de locutor (TIMIT). A avaliação foi realizada comparando a segmentação automática com a segmentação manual. Depois do processo de refinamento, um ganho de 29% nas fronteiras com erro de segmentação abaixo de 20 ms foi obtido para a base de fala dependente de locutor masculino do Português Brasileiro.Abstract: The demand for reliable automatic speech segmentation is increasing and requiring additional research to support the development of systems that use speech for man-machine interface. In this context, this work reports the development and evaluation of a system for automatic speech segmentation using Viterbi's algorithm and a refinement of segmentation boundaries based on acoustic-phonetic features. Phonetic sub-units (context-dependent phones) are modeled with HMM (Hidden Markov Models). Each boundary estimated by Viterbi's algorithm is refined using class-dependent acoustic features, as the identity of the phones on the left and right side of the considered boundary is known. The proposed system was evaluated using two speaker dependent Brazilian Portuguese speech databases (one male and one female speaker), and a speaker independent English database (TIMIT). The evaluation was carried out comparing automatic against manual segmentation. After the refinement process, an improvement of 29% in the percentage of segmentation errors below 20 ms was achieved for the male speaker dependent Brazilian Portuguese speech database.DoutoradoTelecomunicações e TelemáticaDoutor em Engenharia Elétrica[s.n.]Violaro, Fábio, 1950-Ynoguti, Carlos AlbertoKlautau, AldebaroBarbedo, Jaime Garcia ArnalBarbosa, Plinio AlmeidaUniversidade Estadual de Campinas (UNICAMP). Faculdade de Engenharia Elétrica e de ComputaçãoPrograma de Pós-Graduação em Engenharia ElétricaUNIVERSIDADE ESTADUAL DE CAMPINASSelmini, Antonio Marcos20082008-08-22T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdf191p. : il.https://hdl.handle.net/20.500.12733/1607918SELMINI, Antonio Marcos. Sistema baseado em regras para o refinamento da segmentação automatica de fala. 2008. 191p. Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1607918. Acesso em: 2 set. 2024.https://repositorio.unicamp.br/acervo/detalhe/433164porreponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)instname:Universidade Estadual de Campinas (UNICAMP)instacron:UNICAMPinfo:eu-repo/semantics/openAccess2017-02-18T05:19:07Zoai::433164Biblioteca Digital de Teses e DissertaçõesPUBhttp://repositorio.unicamp.br/oai/tese/oai.aspsbubd@unicamp.bropendoar:2017-02-18T05:19:07Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)false
dc.title.none.fl_str_mv	Sistema baseado em regras para o refinamento da segmentação automatica de fala Rule based system for refining the automatic speech segmentation
title	Sistema baseado em regras para o refinamento da segmentação automatica de fala
spellingShingle	Sistema baseado em regras para o refinamento da segmentação automatica de fala Selmini, Antonio Marcos Sistemas de processamento da fala Fonética acústica Reconhecimento automático da voz Processos de Markov Automatic speech segmentation Acoustic-phonetic features HMM modelling Viterbi's algorithm Refining the automatic speech segmentation
title_short	Sistema baseado em regras para o refinamento da segmentação automatica de fala
title_full	Sistema baseado em regras para o refinamento da segmentação automatica de fala
title_fullStr	Sistema baseado em regras para o refinamento da segmentação automatica de fala
title_full_unstemmed	Sistema baseado em regras para o refinamento da segmentação automatica de fala
title_sort	Sistema baseado em regras para o refinamento da segmentação automatica de fala
author	Selmini, Antonio Marcos
author_facet	Selmini, Antonio Marcos
author_role	author
dc.contributor.none.fl_str_mv	Violaro, Fábio, 1950- Ynoguti, Carlos Alberto Klautau, Aldebaro Barbedo, Jaime Garcia Arnal Barbosa, Plinio Almeida Universidade Estadual de Campinas (UNICAMP). Faculdade de Engenharia Elétrica e de Computação Programa de Pós-Graduação em Engenharia Elétrica UNIVERSIDADE ESTADUAL DE CAMPINAS
dc.contributor.author.fl_str_mv	Selmini, Antonio Marcos
dc.subject.por.fl_str_mv	Sistemas de processamento da fala Fonética acústica Reconhecimento automático da voz Processos de Markov Automatic speech segmentation Acoustic-phonetic features HMM modelling Viterbi's algorithm Refining the automatic speech segmentation
topic	Sistemas de processamento da fala Fonética acústica Reconhecimento automático da voz Processos de Markov Automatic speech segmentation Acoustic-phonetic features HMM modelling Viterbi's algorithm Refining the automatic speech segmentation
description	Orientador: Fabio Violaro
publishDate	2008
dc.date.none.fl_str_mv	2008 2008-08-22T00:00:00Z
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/doctoralThesis
format	doctoralThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	https://hdl.handle.net/20.500.12733/1607918 SELMINI, Antonio Marcos. Sistema baseado em regras para o refinamento da segmentação automatica de fala. 2008. 191p. Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1607918. Acesso em: 2 set. 2024.
url	https://hdl.handle.net/20.500.12733/1607918
identifier_str_mv	SELMINI, Antonio Marcos. Sistema baseado em regras para o refinamento da segmentação automatica de fala. 2008. 191p. Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1607918. Acesso em: 2 set. 2024.
dc.language.iso.fl_str_mv	por
language	por
dc.relation.none.fl_str_mv	https://repositorio.unicamp.br/acervo/detalhe/433164
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf 191p. : il.
dc.publisher.none.fl_str_mv	[s.n.]
publisher.none.fl_str_mv	[s.n.]
dc.source.none.fl_str_mv	reponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) instname:Universidade Estadual de Campinas (UNICAMP) instacron:UNICAMP
instname_str	Universidade Estadual de Campinas (UNICAMP)
instacron_str	UNICAMP
institution	UNICAMP
reponame_str	Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
collection	Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
repository.name.fl_str_mv	Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)
repository.mail.fl_str_mv	sbubd@unicamp.br
_version_	1809188993430978560

Sistema baseado em regras para o refinamento da segmentação automatica de fala

Registros relacionados