Projeto e avaliação de dicionários para quantização vetorial de voz e imagem.

Detalhes bibliográficos
Autor(a) principal: BERNARDINO JÚNIOR, Francisco Madeiro.
Data de Publicação: 2001
Tipo de documento: Tese
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da UFCG
Texto Completo: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/11257
Resumo: Neste trabalho são apresentadas técnicas para projeto de dicionários aplicados a quantização vetorial (QV) de sinais de voz e imagens. A primeira. denominada SOA (self organizing algorithm), e inspirada no algoritmo de Kohonen. Utiliza, no entanto, um paradigma de vizinhança diferente do proposto por Kohonen para atualização dos vetores-código. A segunda, denominada SSC (synaptic space competitive), corresponde a nm algoritmo que utiliza aprendizagem competitiva simples. A terceira, denominada FS-SSC (frequency sensitive SSC), e resultante da introdução do principio de consciência de Grossberg no algoritmo SSC. A quarta técnica, denotada por PCA (como alusão a principal component analysis), utiliza os autovalores e os autovetores (componentes principais) da matriz de covariância de um sinal de voz para calcular os vetores-código do dicionário. São apresentados resultados concernentes a codificação de sinais de voz e imagem baseada em QV simples (convencional) como também em QV no dominio wavelet, alem de resultados referentes ao reconhecimento de locutores baseado em QV paramétrica. Os resultados mostram que os algoritmos SOA, SSC, FS-SSC e PCA apresentam~se como altemativas ao tradicional algoritmo LBG (Linde-Buzo-Gray). E investigada a complexidade computacional dos algoritmos SSC e LBG. São obtidas expressões analíticas (em função do tamanho do dicionario, da dimensão dos seus vetores-código, do numero de vetores do conjunto de treino e do numero de iterações desses algoritmos) que estabelecem as condições que devem ser obedecidas para que o algoritmo SSC seja mais eficiente que o algoritmo LBG quanto ao número de operações (divisões, multiplicações, comparações, adições e subtrações) realizadas durante o projeto do dicionario. 0 presente trabalho também apresenta um método para redução da complexidade computacional da etapa de codificação da QV. 0 método proposto utiliza a organização estruturada dos dicionários PCA para reduzir significativamente o numero de operações realizadas na etapa de determinação do vizinho mais próximo de cada vetor a ser codificado bem como para minimizar os requisitos de memória exigida para armazenar o dicionário.
id UFCG_1d2bafc4a39c49714087d824f87b73e3
oai_identifier_str oai:localhost:riufcg/11257
network_acronym_str UFCG
network_name_str Biblioteca Digital de Teses e Dissertações da UFCG
repository_id_str 4851
spelling Projeto e avaliação de dicionários para quantização vetorial de voz e imagem.Design and evaluation of dictionaries for vector quantization of voice and image.Quantização Vetorial (QV)Sinais de Voz e ImagensProcessamento Digital de VozProcessamento Digital de ImagemProcessamento da InformaçãoDicionáriosAlgoritmo de KohonenFrequency Sensitive SSC (FS-SSC)Edução da Complexidade ComputacionalVector Quantization (QOL)Voice Signals and ImagesDigital Voice ProcessingDigital Image ProcessingInformation ProcessingDictionariesKohonen's AlgorithmSynaptic Space Competitive (SSC)Frequency Sensitive SSC (FS-SSC)Eduction of Computational ComplexityEngenharia ElétricaNeste trabalho são apresentadas técnicas para projeto de dicionários aplicados a quantização vetorial (QV) de sinais de voz e imagens. A primeira. denominada SOA (self organizing algorithm), e inspirada no algoritmo de Kohonen. Utiliza, no entanto, um paradigma de vizinhança diferente do proposto por Kohonen para atualização dos vetores-código. A segunda, denominada SSC (synaptic space competitive), corresponde a nm algoritmo que utiliza aprendizagem competitiva simples. A terceira, denominada FS-SSC (frequency sensitive SSC), e resultante da introdução do principio de consciência de Grossberg no algoritmo SSC. A quarta técnica, denotada por PCA (como alusão a principal component analysis), utiliza os autovalores e os autovetores (componentes principais) da matriz de covariância de um sinal de voz para calcular os vetores-código do dicionário. São apresentados resultados concernentes a codificação de sinais de voz e imagem baseada em QV simples (convencional) como também em QV no dominio wavelet, alem de resultados referentes ao reconhecimento de locutores baseado em QV paramétrica. Os resultados mostram que os algoritmos SOA, SSC, FS-SSC e PCA apresentam~se como altemativas ao tradicional algoritmo LBG (Linde-Buzo-Gray). E investigada a complexidade computacional dos algoritmos SSC e LBG. São obtidas expressões analíticas (em função do tamanho do dicionario, da dimensão dos seus vetores-código, do numero de vetores do conjunto de treino e do numero de iterações desses algoritmos) que estabelecem as condições que devem ser obedecidas para que o algoritmo SSC seja mais eficiente que o algoritmo LBG quanto ao número de operações (divisões, multiplicações, comparações, adições e subtrações) realizadas durante o projeto do dicionario. 0 presente trabalho também apresenta um método para redução da complexidade computacional da etapa de codificação da QV. 0 método proposto utiliza a organização estruturada dos dicionários PCA para reduzir significativamente o numero de operações realizadas na etapa de determinação do vizinho mais próximo de cada vetor a ser codificado bem como para minimizar os requisitos de memória exigida para armazenar o dicionário.This work presents techniques for designing codebooks applied to vector quantization (VQ) of speech signals and images. The first technique, referred to as SOA (selforganizing algorithm), is inspired on Kohonen's algorithm. The unsupervised learning algorithm SOA, however, uses a neighborhood paradigm which differs from that of Kohonen for updating the codevectors. The second, referred to as SSC (synaptic space competitive), corresponds to an algorithm that uses competitive learning. The third, referred to as FS-SSC (frequency sensitive SSC), introduces Grossberg's conscience principle on SSC algorithm. The fourth technique, referred to as PCA (as an allusion to principal component analysis), computes the VQ codebooks taking into account the eigenvalues and the eigenvectors (principal components) of the covariance matrix of a speech signal. This work presents results concerning speech and image coding based upon simple (conventional) VQ and based upon wavelet VQ, as well as results regarding speaker recognition based upon parametric VQ. Results show that the algorithms SOA, SSC, FS-SSC and PCA are alternatives to the traditional LBG (Linde-Buzo-Gray) algorithm. The computational complexity of the algorithms SSC and LBG is investigated. Analytical expressions (as a function of the codebook size, the dimension of the codevectors, the number of vectors in the training set and the number of iterations executed for codebook design) are derived for the number of operations (multiplications, divisions, additions, subtractions and comparisons) executed by SSC and LBG. Constraints are obtained under which the SSC algorithm is more efficient than the LBG algorithm in terms of number of operations executed in codebook design. The work also presents a method for reducing the computational complexity of the minimum distortion encoding (MDE) of VQ. The proposed method uses the structured organization of the PCA codebooks for significantly reducing the number of operations executed in the process of determining the nearest neighbor for each source vector to be coded, as well as for reducing the memory requirements for codebook storage.Universidade Federal de Campina GrandeBrasilCentro de Engenharia Elétrica e Informática - CEEIPÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICAUFCGAGUIAR NETO, Benedito Guimarães.ALENCAR, Marcelo Sampaio de.AGUIAR NETO, B. G.ALENCAR, M. S.http://lattes.cnpq.br/3405447548131544http://lattes.cnpq.br/0946722048975388ALENCAR, Marcelo Sampaio de.ALENCAR, M. S.http://lattes.cnpq.br/0946722048975388ALCAIM, Abraham.CALÔBA, Luiz Pereira.SOUSA, Ricardo Menezes Campello de.CARVALHO, João Marques de.BERNARDINO JÚNIOR, Francisco Madeiro.2001-12-142020-01-27T18:00:47Z2020-01-272020-01-27T18:00:47Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesishttp://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/11257BERNARDINO JUNIOR, Francisco Madeiro. Projeto e avaliação de dicionários para quantização vetorial de voz e imagem. 244f. (Tese) Doutorado em Engenharia Elétrica, Curso de Pós-Graduação em Engenharia Elétrica, Centro de Ciências e Tecnologia e Informática ,Universidade Federal da Paraíba – Campus II - Campina Grande - Paraíba - Brasil, 2001.porinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFCGinstname:Universidade Federal de Campina Grande (UFCG)instacron:UFCG2021-04-16T11:46:47Zoai:localhost:riufcg/11257Biblioteca Digital de Teses e Dissertaçõeshttp://bdtd.ufcg.edu.br/PUBhttp://dspace.sti.ufcg.edu.br:8080/oai/requestbdtd@setor.ufcg.edu.br || bdtd@setor.ufcg.edu.bropendoar:48512021-04-16T11:46:47Biblioteca Digital de Teses e Dissertações da UFCG - Universidade Federal de Campina Grande (UFCG)false
dc.title.none.fl_str_mv Projeto e avaliação de dicionários para quantização vetorial de voz e imagem.
Design and evaluation of dictionaries for vector quantization of voice and image.
title Projeto e avaliação de dicionários para quantização vetorial de voz e imagem.
spellingShingle Projeto e avaliação de dicionários para quantização vetorial de voz e imagem.
BERNARDINO JÚNIOR, Francisco Madeiro.
Quantização Vetorial (QV)
Sinais de Voz e Imagens
Processamento Digital de Voz
Processamento Digital de Imagem
Processamento da Informação
Dicionários
Algoritmo de Kohonen
Frequency Sensitive SSC (FS-SSC)
Edução da Complexidade Computacional
Vector Quantization (QOL)
Voice Signals and Images
Digital Voice Processing
Digital Image Processing
Information Processing
Dictionaries
Kohonen's Algorithm
Synaptic Space Competitive (SSC)
Frequency Sensitive SSC (FS-SSC)
Eduction of Computational Complexity
Engenharia Elétrica
title_short Projeto e avaliação de dicionários para quantização vetorial de voz e imagem.
title_full Projeto e avaliação de dicionários para quantização vetorial de voz e imagem.
title_fullStr Projeto e avaliação de dicionários para quantização vetorial de voz e imagem.
title_full_unstemmed Projeto e avaliação de dicionários para quantização vetorial de voz e imagem.
title_sort Projeto e avaliação de dicionários para quantização vetorial de voz e imagem.
author BERNARDINO JÚNIOR, Francisco Madeiro.
author_facet BERNARDINO JÚNIOR, Francisco Madeiro.
author_role author
dc.contributor.none.fl_str_mv AGUIAR NETO, Benedito Guimarães.
ALENCAR, Marcelo Sampaio de.
AGUIAR NETO, B. G.
ALENCAR, M. S.
http://lattes.cnpq.br/3405447548131544
http://lattes.cnpq.br/0946722048975388
ALENCAR, Marcelo Sampaio de.
ALENCAR, M. S.
http://lattes.cnpq.br/0946722048975388
ALCAIM, Abraham.
CALÔBA, Luiz Pereira.
SOUSA, Ricardo Menezes Campello de.
CARVALHO, João Marques de.
dc.contributor.author.fl_str_mv BERNARDINO JÚNIOR, Francisco Madeiro.
dc.subject.por.fl_str_mv Quantização Vetorial (QV)
Sinais de Voz e Imagens
Processamento Digital de Voz
Processamento Digital de Imagem
Processamento da Informação
Dicionários
Algoritmo de Kohonen
Frequency Sensitive SSC (FS-SSC)
Edução da Complexidade Computacional
Vector Quantization (QOL)
Voice Signals and Images
Digital Voice Processing
Digital Image Processing
Information Processing
Dictionaries
Kohonen's Algorithm
Synaptic Space Competitive (SSC)
Frequency Sensitive SSC (FS-SSC)
Eduction of Computational Complexity
Engenharia Elétrica
topic Quantização Vetorial (QV)
Sinais de Voz e Imagens
Processamento Digital de Voz
Processamento Digital de Imagem
Processamento da Informação
Dicionários
Algoritmo de Kohonen
Frequency Sensitive SSC (FS-SSC)
Edução da Complexidade Computacional
Vector Quantization (QOL)
Voice Signals and Images
Digital Voice Processing
Digital Image Processing
Information Processing
Dictionaries
Kohonen's Algorithm
Synaptic Space Competitive (SSC)
Frequency Sensitive SSC (FS-SSC)
Eduction of Computational Complexity
Engenharia Elétrica
description Neste trabalho são apresentadas técnicas para projeto de dicionários aplicados a quantização vetorial (QV) de sinais de voz e imagens. A primeira. denominada SOA (self organizing algorithm), e inspirada no algoritmo de Kohonen. Utiliza, no entanto, um paradigma de vizinhança diferente do proposto por Kohonen para atualização dos vetores-código. A segunda, denominada SSC (synaptic space competitive), corresponde a nm algoritmo que utiliza aprendizagem competitiva simples. A terceira, denominada FS-SSC (frequency sensitive SSC), e resultante da introdução do principio de consciência de Grossberg no algoritmo SSC. A quarta técnica, denotada por PCA (como alusão a principal component analysis), utiliza os autovalores e os autovetores (componentes principais) da matriz de covariância de um sinal de voz para calcular os vetores-código do dicionário. São apresentados resultados concernentes a codificação de sinais de voz e imagem baseada em QV simples (convencional) como também em QV no dominio wavelet, alem de resultados referentes ao reconhecimento de locutores baseado em QV paramétrica. Os resultados mostram que os algoritmos SOA, SSC, FS-SSC e PCA apresentam~se como altemativas ao tradicional algoritmo LBG (Linde-Buzo-Gray). E investigada a complexidade computacional dos algoritmos SSC e LBG. São obtidas expressões analíticas (em função do tamanho do dicionario, da dimensão dos seus vetores-código, do numero de vetores do conjunto de treino e do numero de iterações desses algoritmos) que estabelecem as condições que devem ser obedecidas para que o algoritmo SSC seja mais eficiente que o algoritmo LBG quanto ao número de operações (divisões, multiplicações, comparações, adições e subtrações) realizadas durante o projeto do dicionario. 0 presente trabalho também apresenta um método para redução da complexidade computacional da etapa de codificação da QV. 0 método proposto utiliza a organização estruturada dos dicionários PCA para reduzir significativamente o numero de operações realizadas na etapa de determinação do vizinho mais próximo de cada vetor a ser codificado bem como para minimizar os requisitos de memória exigida para armazenar o dicionário.
publishDate 2001
dc.date.none.fl_str_mv 2001-12-14
2020-01-27T18:00:47Z
2020-01-27
2020-01-27T18:00:47Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/11257
BERNARDINO JUNIOR, Francisco Madeiro. Projeto e avaliação de dicionários para quantização vetorial de voz e imagem. 244f. (Tese) Doutorado em Engenharia Elétrica, Curso de Pós-Graduação em Engenharia Elétrica, Centro de Ciências e Tecnologia e Informática ,Universidade Federal da Paraíba – Campus II - Campina Grande - Paraíba - Brasil, 2001.
url http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/11257
identifier_str_mv BERNARDINO JUNIOR, Francisco Madeiro. Projeto e avaliação de dicionários para quantização vetorial de voz e imagem. 244f. (Tese) Doutorado em Engenharia Elétrica, Curso de Pós-Graduação em Engenharia Elétrica, Centro de Ciências e Tecnologia e Informática ,Universidade Federal da Paraíba – Campus II - Campina Grande - Paraíba - Brasil, 2001.
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Campina Grande
Brasil
Centro de Engenharia Elétrica e Informática - CEEI
PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA
UFCG
publisher.none.fl_str_mv Universidade Federal de Campina Grande
Brasil
Centro de Engenharia Elétrica e Informática - CEEI
PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA
UFCG
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFCG
instname:Universidade Federal de Campina Grande (UFCG)
instacron:UFCG
instname_str Universidade Federal de Campina Grande (UFCG)
instacron_str UFCG
institution UFCG
reponame_str Biblioteca Digital de Teses e Dissertações da UFCG
collection Biblioteca Digital de Teses e Dissertações da UFCG
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFCG - Universidade Federal de Campina Grande (UFCG)
repository.mail.fl_str_mv bdtd@setor.ufcg.edu.br || bdtd@setor.ufcg.edu.br
_version_ 1809744431062974464