Estudo de algoritmos de quantização vetorial aplicados a sinais de fala

Detalhes bibliográficos
Autor(a) principal: Violato, Ricardo Paranhos Velloso
Data de Publicação: 2010
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
Texto Completo: https://hdl.handle.net/20.500.12733/1612733
Resumo: Orientador: Fernando José Von Zuben
id UNICAMP-30_897af56163e4185a003e319003c16860
oai_identifier_str oai::772781
network_acronym_str UNICAMP-30
network_name_str Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
repository_id_str
spelling Estudo de algoritmos de quantização vetorial aplicados a sinais de falaStudy of vector quantization algorithms applied to speech signalsSistemas de processamento da falaAlgoritmos - Processamento de dadosAprendizado de máquinaInteligência artificial - Processamento de dadosSpeech codingSpeech processing systemsAlgorithms - Data processinLearning computerArtificial intelligence - Data processingOrientador: Fernando José Von ZubenDissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Elétrica e de ComputaçãoResumo: Este trabalho apresenta um estudo comparativo de três algoritmos de quantização vetorial, aplicados para a compressão de sinais de fala: k-médias, NG (do inglês Neural-Gas) e ARIA. Na técnica de compressão utilizada, os sinais são primeiramente parametrizados e quantizados, para serem armazenados e/ou transmitidos. Para recompor o sinal, os vetores quantizados são mapeados em quadros de fala, que são, por sua vez, concatenados, através de uma técnica de síntese concatenativa. Esse sistema pressupõe a existência de um dicionário (codebook) de vetores-padrão (codevectors), os quais são utilizados na etapa de codificação, e de um dicionário de quadros, que é utilizado na etapa de decodificação. Tais dicionários são gerados aplicando-se um algoritmo de quantização vetorial juntoa uma base de treinamento. Em particular, deseja-se avaliar o algoritmo imuno-inspirado denominado ARIA e sua capacidade de preservação da densidade da distribuição dos dados. São testados também diferentes conjuntos de parâmetros para identificar aquele que produz os melhores resultados. Por fim, são propostas modificações no algoritmo ARIA visando ganho de desempenho tanto na preservação de densidade quanto na qualidade do sinal sintetizadoAbstract: This work presents a comparative study of three algorithms for vector quantization, applied for the compression of speech signals: k-means, NG (Neural-Gas) and ARIA. In the compression technique used, the signals are first parameterized and quantized to be stored and/or transmitted. To reconstruct the signal, the quantized vectors are mapped into speech frames, which are concatenated through a concatenative synthesis technique. This system assumes the existence of a dictionary (codebook) of reference vectors (codevectors), which is used in the coding step, and a dictionary of frames, which is used in the decoding step. These dictionaries are generated by applying a vector quantization algorithm within a training database. In particular, we want to evaluate the immune-inspired algorithm called ARIA and its ability to preserve the density of data distribution. Different sets of parameters are also tested in order to identify the one that produces the best results. Finally, modifications to the ARIA algorithm are proposed aiming at obtaining gain in performance in both the preservation of density and the quality of the synthesized signalMestradoEngenharia de ComputaçãoMestre em Engenharia Elétrica[s.n.]Von Zuben, Fernando José, 1968-Von Zuben, Fernando José, 1968-Peres, Sarajane MarquesAttux, Romis Ribeiro de FaissolUniversidade Estadual de Campinas (UNICAMP). Faculdade de Engenharia Elétrica e de ComputaçãoPrograma de Pós-Graduação em Engenharia ElétricaUNIVERSIDADE ESTADUAL DE CAMPINASViolato, Ricardo Paranhos Velloso20102010-08-07T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdf110 p. : il.https://hdl.handle.net/20.500.12733/1612733VIOLATO, Ricardo Paranhos Velloso. Estudo de algoritmos de quantização vetorial aplicados a sinais de fala. 2010. 110 p. Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Elétrica e de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1612733. Acesso em: 3 set. 2024.https://repositorio.unicamp.br/acervo/detalhe/772781porreponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)instname:Universidade Estadual de Campinas (UNICAMP)instacron:UNICAMPinfo:eu-repo/semantics/openAccess2017-02-18T05:57:36Zoai::772781Biblioteca Digital de Teses e DissertaçõesPUBhttp://repositorio.unicamp.br/oai/tese/oai.aspsbubd@unicamp.bropendoar:2017-02-18T05:57:36Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)false
dc.title.none.fl_str_mv Estudo de algoritmos de quantização vetorial aplicados a sinais de fala
Study of vector quantization algorithms applied to speech signals
title Estudo de algoritmos de quantização vetorial aplicados a sinais de fala
spellingShingle Estudo de algoritmos de quantização vetorial aplicados a sinais de fala
Violato, Ricardo Paranhos Velloso
Sistemas de processamento da fala
Algoritmos - Processamento de dados
Aprendizado de máquina
Inteligência artificial - Processamento de dados
Speech coding
Speech processing systems
Algorithms - Data processin
Learning computer
Artificial intelligence - Data processing
title_short Estudo de algoritmos de quantização vetorial aplicados a sinais de fala
title_full Estudo de algoritmos de quantização vetorial aplicados a sinais de fala
title_fullStr Estudo de algoritmos de quantização vetorial aplicados a sinais de fala
title_full_unstemmed Estudo de algoritmos de quantização vetorial aplicados a sinais de fala
title_sort Estudo de algoritmos de quantização vetorial aplicados a sinais de fala
author Violato, Ricardo Paranhos Velloso
author_facet Violato, Ricardo Paranhos Velloso
author_role author
dc.contributor.none.fl_str_mv Von Zuben, Fernando José, 1968-
Von Zuben, Fernando José, 1968-
Peres, Sarajane Marques
Attux, Romis Ribeiro de Faissol
Universidade Estadual de Campinas (UNICAMP). Faculdade de Engenharia Elétrica e de Computação
Programa de Pós-Graduação em Engenharia Elétrica
UNIVERSIDADE ESTADUAL DE CAMPINAS
dc.contributor.author.fl_str_mv Violato, Ricardo Paranhos Velloso
dc.subject.por.fl_str_mv Sistemas de processamento da fala
Algoritmos - Processamento de dados
Aprendizado de máquina
Inteligência artificial - Processamento de dados
Speech coding
Speech processing systems
Algorithms - Data processin
Learning computer
Artificial intelligence - Data processing
topic Sistemas de processamento da fala
Algoritmos - Processamento de dados
Aprendizado de máquina
Inteligência artificial - Processamento de dados
Speech coding
Speech processing systems
Algorithms - Data processin
Learning computer
Artificial intelligence - Data processing
description Orientador: Fernando José Von Zuben
publishDate 2010
dc.date.none.fl_str_mv 2010
2010-08-07T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://hdl.handle.net/20.500.12733/1612733
VIOLATO, Ricardo Paranhos Velloso. Estudo de algoritmos de quantização vetorial aplicados a sinais de fala. 2010. 110 p. Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Elétrica e de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1612733. Acesso em: 3 set. 2024.
url https://hdl.handle.net/20.500.12733/1612733
identifier_str_mv VIOLATO, Ricardo Paranhos Velloso. Estudo de algoritmos de quantização vetorial aplicados a sinais de fala. 2010. 110 p. Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Elétrica e de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1612733. Acesso em: 3 set. 2024.
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv https://repositorio.unicamp.br/acervo/detalhe/772781
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
110 p. : il.
dc.publisher.none.fl_str_mv [s.n.]
publisher.none.fl_str_mv [s.n.]
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
instname:Universidade Estadual de Campinas (UNICAMP)
instacron:UNICAMP
instname_str Universidade Estadual de Campinas (UNICAMP)
instacron_str UNICAMP
institution UNICAMP
reponame_str Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
collection Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)
repository.mail.fl_str_mv sbubd@unicamp.br
_version_ 1809189036212879360