Segmentação de voz baseada na análise fractal e na transformada wavelet.

Fantinato, Paulo César

Segmentação de voz baseada na análise fractal e na transformada wavelet.

Detalhes bibliográficos
Autor(a) principal:	Fantinato, Paulo César
Data de Publicação:	2008
Tipo de documento:	Dissertação
Idioma:	por
Título da fonte:	Biblioteca Digital de Teses e Dissertações da USP
Texto Completo:	http://www.teses.usp.br/teses/disponiveis/76/76132/tde-11122008-194055/
Resumo:	Ultimamente, a análise fractal (AF) vem sendo utilizada com sucesso na área de processamento digital de voz, especialmente para fins de segmentação de palavras e fonemas, que é uma das etapas fundamentais dos sistemas de reconhecimento automático de fala (Automatic Speech Recognition - ASR ) e identificação automática de locutor (Automatic Speaker Identification - ASI). O uso prático da AF para ASR e ASI depende de dois fatores básicos: baixo custo computacional, para permitir o uso em tempo-real, e precisão nos resultados, para produzir a segmentação correta e entregar dados coerentes à etapa de classificação. Visando atender a esses objetivos, o presente trabalho propõe uma técnica de segmentação de sinais de voz baseada na dimensão do fractal, obtida com o uso da transformada wavelet discreta (DWT). Diversas famílias de wavelets são testadas e comparadas, sendo que os testes foram realizados com algumas sentenças extraídas da base de dados TIMIT do Linguistic Data Consortium (LDC).

Metadados do item

id	USP_99fe3361e281ccd2defb0219ff5af4eb
oai_identifier_str	oai:teses.usp.br:tde-11122008-194055
network_acronym_str	USP
network_name_str	Biblioteca Digital de Teses e Dissertações da USP
repository_id_str	2721
spelling	Segmentação de voz baseada na análise fractal e na transformada wavelet.Speech segmentation based on fractal analysis and wavelet transform.1. Speech 2. Fractals 3. Wavelets1. Voz. 2. Fractais. 3. Wavelets.Ultimamente, a análise fractal (AF) vem sendo utilizada com sucesso na área de processamento digital de voz, especialmente para fins de segmentação de palavras e fonemas, que é uma das etapas fundamentais dos sistemas de reconhecimento automático de fala (Automatic Speech Recognition - ASR ) e identificação automática de locutor (Automatic Speaker Identification - ASI). O uso prático da AF para ASR e ASI depende de dois fatores básicos: baixo custo computacional, para permitir o uso em tempo-real, e precisão nos resultados, para produzir a segmentação correta e entregar dados coerentes à etapa de classificação. Visando atender a esses objetivos, o presente trabalho propõe uma técnica de segmentação de sinais de voz baseada na dimensão do fractal, obtida com o uso da transformada wavelet discreta (DWT). Diversas famílias de wavelets são testadas e comparadas, sendo que os testes foram realizados com algumas sentenças extraídas da base de dados TIMIT do Linguistic Data Consortium (LDC).Nowadays, fractal analysis has been successfully applied to digital speech processing, particularly for words and phonemes segmentation, which represents one of the fundamental steps in automatic speech recognition and speaker identification systems. The practical use of fractal analysis for these purposes should match two principles: low computational cost, to allow use in real-time, and accuracy in the results, to produce a correct segmentation, delivering consistent data to the classifier. Aiming at meeting these two requirements, this work proposes a technique for speech segmentation based on the fractal dimension, obtained by using the discrete wavelet transform (DWT). Many families of wavelets were tested and compared, being the experiments performed with speech data collected from TIMIT corpus provided by the Linguistic Data Consortium.Biblioteca Digitais de Teses e Dissertações da USPGuido, Rodrigo CapobiancoFantinato, Paulo César2008-12-02info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://www.teses.usp.br/teses/disponiveis/76/76132/tde-11122008-194055/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2016-07-28T16:09:57Zoai:teses.usp.br:tde-11122008-194055Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br\|\| atendimento@aguia.usp.br\|\|virginia@if.usp.bropendoar:27212016-07-28T16:09:57Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv	Segmentação de voz baseada na análise fractal e na transformada wavelet. Speech segmentation based on fractal analysis and wavelet transform.
title	Segmentação de voz baseada na análise fractal e na transformada wavelet.
spellingShingle	Segmentação de voz baseada na análise fractal e na transformada wavelet. Fantinato, Paulo César 1. Speech 2. Fractals 3. Wavelets 1. Voz. 2. Fractais. 3. Wavelets.
title_short	Segmentação de voz baseada na análise fractal e na transformada wavelet.
title_full	Segmentação de voz baseada na análise fractal e na transformada wavelet.
title_fullStr	Segmentação de voz baseada na análise fractal e na transformada wavelet.
title_full_unstemmed	Segmentação de voz baseada na análise fractal e na transformada wavelet.
title_sort	Segmentação de voz baseada na análise fractal e na transformada wavelet.
author	Fantinato, Paulo César
author_facet	Fantinato, Paulo César
author_role	author
dc.contributor.none.fl_str_mv	Guido, Rodrigo Capobianco
dc.contributor.author.fl_str_mv	Fantinato, Paulo César
dc.subject.por.fl_str_mv	1. Speech 2. Fractals 3. Wavelets 1. Voz. 2. Fractais. 3. Wavelets.
topic	1. Speech 2. Fractals 3. Wavelets 1. Voz. 2. Fractais. 3. Wavelets.
description	Ultimamente, a análise fractal (AF) vem sendo utilizada com sucesso na área de processamento digital de voz, especialmente para fins de segmentação de palavras e fonemas, que é uma das etapas fundamentais dos sistemas de reconhecimento automático de fala (Automatic Speech Recognition - ASR ) e identificação automática de locutor (Automatic Speaker Identification - ASI). O uso prático da AF para ASR e ASI depende de dois fatores básicos: baixo custo computacional, para permitir o uso em tempo-real, e precisão nos resultados, para produzir a segmentação correta e entregar dados coerentes à etapa de classificação. Visando atender a esses objetivos, o presente trabalho propõe uma técnica de segmentação de sinais de voz baseada na dimensão do fractal, obtida com o uso da transformada wavelet discreta (DWT). Diversas famílias de wavelets são testadas e comparadas, sendo que os testes foram realizados com algumas sentenças extraídas da base de dados TIMIT do Linguistic Data Consortium (LDC).
publishDate	2008
dc.date.none.fl_str_mv	2008-12-02
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	http://www.teses.usp.br/teses/disponiveis/76/76132/tde-11122008-194055/
url	http://www.teses.usp.br/teses/disponiveis/76/76132/tde-11122008-194055/
dc.language.iso.fl_str_mv	por
language	por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv	Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess
rights_invalid_str_mv	Liberar o conteúdo para acesso público.
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv	Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv	Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv	reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP
instname_str	Universidade de São Paulo (USP)
instacron_str	USP
institution	USP
reponame_str	Biblioteca Digital de Teses e Dissertações da USP
collection	Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv	Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv	virginia@if.usp.br\|\| atendimento@aguia.usp.br\|\|virginia@if.usp.br
_version_	1809090633271345152

Segmentação de voz baseada na análise fractal e na transformada wavelet.

Registros relacionados