Projeto e avaliação de dicionários para quantização vetorial de voz e imagem.
Autor(a) principal: | |
---|---|
Data de Publicação: | 2001 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da UFCG |
Texto Completo: | http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/11257 |
Resumo: | Neste trabalho são apresentadas técnicas para projeto de dicionários aplicados a quantização vetorial (QV) de sinais de voz e imagens. A primeira. denominada SOA (self organizing algorithm), e inspirada no algoritmo de Kohonen. Utiliza, no entanto, um paradigma de vizinhança diferente do proposto por Kohonen para atualização dos vetores-código. A segunda, denominada SSC (synaptic space competitive), corresponde a nm algoritmo que utiliza aprendizagem competitiva simples. A terceira, denominada FS-SSC (frequency sensitive SSC), e resultante da introdução do principio de consciência de Grossberg no algoritmo SSC. A quarta técnica, denotada por PCA (como alusão a principal component analysis), utiliza os autovalores e os autovetores (componentes principais) da matriz de covariância de um sinal de voz para calcular os vetores-código do dicionário. São apresentados resultados concernentes a codificação de sinais de voz e imagem baseada em QV simples (convencional) como também em QV no dominio wavelet, alem de resultados referentes ao reconhecimento de locutores baseado em QV paramétrica. Os resultados mostram que os algoritmos SOA, SSC, FS-SSC e PCA apresentam~se como altemativas ao tradicional algoritmo LBG (Linde-Buzo-Gray). E investigada a complexidade computacional dos algoritmos SSC e LBG. São obtidas expressões analíticas (em função do tamanho do dicionario, da dimensão dos seus vetores-código, do numero de vetores do conjunto de treino e do numero de iterações desses algoritmos) que estabelecem as condições que devem ser obedecidas para que o algoritmo SSC seja mais eficiente que o algoritmo LBG quanto ao número de operações (divisões, multiplicações, comparações, adições e subtrações) realizadas durante o projeto do dicionario. 0 presente trabalho também apresenta um método para redução da complexidade computacional da etapa de codificação da QV. 0 método proposto utiliza a organização estruturada dos dicionários PCA para reduzir significativamente o numero de operações realizadas na etapa de determinação do vizinho mais próximo de cada vetor a ser codificado bem como para minimizar os requisitos de memória exigida para armazenar o dicionário. |
id |
UFCG_1d2bafc4a39c49714087d824f87b73e3 |
---|---|
oai_identifier_str |
oai:localhost:riufcg/11257 |
network_acronym_str |
UFCG |
network_name_str |
Biblioteca Digital de Teses e Dissertações da UFCG |
repository_id_str |
4851 |
spelling |
Projeto e avaliação de dicionários para quantização vetorial de voz e imagem.Design and evaluation of dictionaries for vector quantization of voice and image.Quantização Vetorial (QV)Sinais de Voz e ImagensProcessamento Digital de VozProcessamento Digital de ImagemProcessamento da InformaçãoDicionáriosAlgoritmo de KohonenFrequency Sensitive SSC (FS-SSC)Edução da Complexidade ComputacionalVector Quantization (QOL)Voice Signals and ImagesDigital Voice ProcessingDigital Image ProcessingInformation ProcessingDictionariesKohonen's AlgorithmSynaptic Space Competitive (SSC)Frequency Sensitive SSC (FS-SSC)Eduction of Computational ComplexityEngenharia ElétricaNeste trabalho são apresentadas técnicas para projeto de dicionários aplicados a quantização vetorial (QV) de sinais de voz e imagens. A primeira. denominada SOA (self organizing algorithm), e inspirada no algoritmo de Kohonen. Utiliza, no entanto, um paradigma de vizinhança diferente do proposto por Kohonen para atualização dos vetores-código. A segunda, denominada SSC (synaptic space competitive), corresponde a nm algoritmo que utiliza aprendizagem competitiva simples. A terceira, denominada FS-SSC (frequency sensitive SSC), e resultante da introdução do principio de consciência de Grossberg no algoritmo SSC. A quarta técnica, denotada por PCA (como alusão a principal component analysis), utiliza os autovalores e os autovetores (componentes principais) da matriz de covariância de um sinal de voz para calcular os vetores-código do dicionário. São apresentados resultados concernentes a codificação de sinais de voz e imagem baseada em QV simples (convencional) como também em QV no dominio wavelet, alem de resultados referentes ao reconhecimento de locutores baseado em QV paramétrica. Os resultados mostram que os algoritmos SOA, SSC, FS-SSC e PCA apresentam~se como altemativas ao tradicional algoritmo LBG (Linde-Buzo-Gray). E investigada a complexidade computacional dos algoritmos SSC e LBG. São obtidas expressões analíticas (em função do tamanho do dicionario, da dimensão dos seus vetores-código, do numero de vetores do conjunto de treino e do numero de iterações desses algoritmos) que estabelecem as condições que devem ser obedecidas para que o algoritmo SSC seja mais eficiente que o algoritmo LBG quanto ao número de operações (divisões, multiplicações, comparações, adições e subtrações) realizadas durante o projeto do dicionario. 0 presente trabalho também apresenta um método para redução da complexidade computacional da etapa de codificação da QV. 0 método proposto utiliza a organização estruturada dos dicionários PCA para reduzir significativamente o numero de operações realizadas na etapa de determinação do vizinho mais próximo de cada vetor a ser codificado bem como para minimizar os requisitos de memória exigida para armazenar o dicionário.This work presents techniques for designing codebooks applied to vector quantization (VQ) of speech signals and images. The first technique, referred to as SOA (selforganizing algorithm), is inspired on Kohonen's algorithm. The unsupervised learning algorithm SOA, however, uses a neighborhood paradigm which differs from that of Kohonen for updating the codevectors. The second, referred to as SSC (synaptic space competitive), corresponds to an algorithm that uses competitive learning. The third, referred to as FS-SSC (frequency sensitive SSC), introduces Grossberg's conscience principle on SSC algorithm. The fourth technique, referred to as PCA (as an allusion to principal component analysis), computes the VQ codebooks taking into account the eigenvalues and the eigenvectors (principal components) of the covariance matrix of a speech signal. This work presents results concerning speech and image coding based upon simple (conventional) VQ and based upon wavelet VQ, as well as results regarding speaker recognition based upon parametric VQ. Results show that the algorithms SOA, SSC, FS-SSC and PCA are alternatives to the traditional LBG (Linde-Buzo-Gray) algorithm. The computational complexity of the algorithms SSC and LBG is investigated. Analytical expressions (as a function of the codebook size, the dimension of the codevectors, the number of vectors in the training set and the number of iterations executed for codebook design) are derived for the number of operations (multiplications, divisions, additions, subtractions and comparisons) executed by SSC and LBG. Constraints are obtained under which the SSC algorithm is more efficient than the LBG algorithm in terms of number of operations executed in codebook design. The work also presents a method for reducing the computational complexity of the minimum distortion encoding (MDE) of VQ. The proposed method uses the structured organization of the PCA codebooks for significantly reducing the number of operations executed in the process of determining the nearest neighbor for each source vector to be coded, as well as for reducing the memory requirements for codebook storage.Universidade Federal de Campina GrandeBrasilCentro de Engenharia Elétrica e Informática - CEEIPÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICAUFCGAGUIAR NETO, Benedito Guimarães.ALENCAR, Marcelo Sampaio de.AGUIAR NETO, B. G.ALENCAR, M. S.http://lattes.cnpq.br/3405447548131544http://lattes.cnpq.br/0946722048975388ALENCAR, Marcelo Sampaio de.ALENCAR, M. S.http://lattes.cnpq.br/0946722048975388ALCAIM, Abraham.CALÔBA, Luiz Pereira.SOUSA, Ricardo Menezes Campello de.CARVALHO, João Marques de.BERNARDINO JÚNIOR, Francisco Madeiro.2001-12-142020-01-27T18:00:47Z2020-01-272020-01-27T18:00:47Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesishttp://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/11257BERNARDINO JUNIOR, Francisco Madeiro. Projeto e avaliação de dicionários para quantização vetorial de voz e imagem. 244f. (Tese) Doutorado em Engenharia Elétrica, Curso de Pós-Graduação em Engenharia Elétrica, Centro de Ciências e Tecnologia e Informática ,Universidade Federal da Paraíba – Campus II - Campina Grande - Paraíba - Brasil, 2001.porinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFCGinstname:Universidade Federal de Campina Grande (UFCG)instacron:UFCG2021-04-16T11:46:47Zoai:localhost:riufcg/11257Biblioteca Digital de Teses e Dissertaçõeshttp://bdtd.ufcg.edu.br/PUBhttp://dspace.sti.ufcg.edu.br:8080/oai/requestbdtd@setor.ufcg.edu.br || bdtd@setor.ufcg.edu.bropendoar:48512021-04-16T11:46:47Biblioteca Digital de Teses e Dissertações da UFCG - Universidade Federal de Campina Grande (UFCG)false |
dc.title.none.fl_str_mv |
Projeto e avaliação de dicionários para quantização vetorial de voz e imagem. Design and evaluation of dictionaries for vector quantization of voice and image. |
title |
Projeto e avaliação de dicionários para quantização vetorial de voz e imagem. |
spellingShingle |
Projeto e avaliação de dicionários para quantização vetorial de voz e imagem. BERNARDINO JÚNIOR, Francisco Madeiro. Quantização Vetorial (QV) Sinais de Voz e Imagens Processamento Digital de Voz Processamento Digital de Imagem Processamento da Informação Dicionários Algoritmo de Kohonen Frequency Sensitive SSC (FS-SSC) Edução da Complexidade Computacional Vector Quantization (QOL) Voice Signals and Images Digital Voice Processing Digital Image Processing Information Processing Dictionaries Kohonen's Algorithm Synaptic Space Competitive (SSC) Frequency Sensitive SSC (FS-SSC) Eduction of Computational Complexity Engenharia Elétrica |
title_short |
Projeto e avaliação de dicionários para quantização vetorial de voz e imagem. |
title_full |
Projeto e avaliação de dicionários para quantização vetorial de voz e imagem. |
title_fullStr |
Projeto e avaliação de dicionários para quantização vetorial de voz e imagem. |
title_full_unstemmed |
Projeto e avaliação de dicionários para quantização vetorial de voz e imagem. |
title_sort |
Projeto e avaliação de dicionários para quantização vetorial de voz e imagem. |
author |
BERNARDINO JÚNIOR, Francisco Madeiro. |
author_facet |
BERNARDINO JÚNIOR, Francisco Madeiro. |
author_role |
author |
dc.contributor.none.fl_str_mv |
AGUIAR NETO, Benedito Guimarães. ALENCAR, Marcelo Sampaio de. AGUIAR NETO, B. G. ALENCAR, M. S. http://lattes.cnpq.br/3405447548131544 http://lattes.cnpq.br/0946722048975388 ALENCAR, Marcelo Sampaio de. ALENCAR, M. S. http://lattes.cnpq.br/0946722048975388 ALCAIM, Abraham. CALÔBA, Luiz Pereira. SOUSA, Ricardo Menezes Campello de. CARVALHO, João Marques de. |
dc.contributor.author.fl_str_mv |
BERNARDINO JÚNIOR, Francisco Madeiro. |
dc.subject.por.fl_str_mv |
Quantização Vetorial (QV) Sinais de Voz e Imagens Processamento Digital de Voz Processamento Digital de Imagem Processamento da Informação Dicionários Algoritmo de Kohonen Frequency Sensitive SSC (FS-SSC) Edução da Complexidade Computacional Vector Quantization (QOL) Voice Signals and Images Digital Voice Processing Digital Image Processing Information Processing Dictionaries Kohonen's Algorithm Synaptic Space Competitive (SSC) Frequency Sensitive SSC (FS-SSC) Eduction of Computational Complexity Engenharia Elétrica |
topic |
Quantização Vetorial (QV) Sinais de Voz e Imagens Processamento Digital de Voz Processamento Digital de Imagem Processamento da Informação Dicionários Algoritmo de Kohonen Frequency Sensitive SSC (FS-SSC) Edução da Complexidade Computacional Vector Quantization (QOL) Voice Signals and Images Digital Voice Processing Digital Image Processing Information Processing Dictionaries Kohonen's Algorithm Synaptic Space Competitive (SSC) Frequency Sensitive SSC (FS-SSC) Eduction of Computational Complexity Engenharia Elétrica |
description |
Neste trabalho são apresentadas técnicas para projeto de dicionários aplicados a quantização vetorial (QV) de sinais de voz e imagens. A primeira. denominada SOA (self organizing algorithm), e inspirada no algoritmo de Kohonen. Utiliza, no entanto, um paradigma de vizinhança diferente do proposto por Kohonen para atualização dos vetores-código. A segunda, denominada SSC (synaptic space competitive), corresponde a nm algoritmo que utiliza aprendizagem competitiva simples. A terceira, denominada FS-SSC (frequency sensitive SSC), e resultante da introdução do principio de consciência de Grossberg no algoritmo SSC. A quarta técnica, denotada por PCA (como alusão a principal component analysis), utiliza os autovalores e os autovetores (componentes principais) da matriz de covariância de um sinal de voz para calcular os vetores-código do dicionário. São apresentados resultados concernentes a codificação de sinais de voz e imagem baseada em QV simples (convencional) como também em QV no dominio wavelet, alem de resultados referentes ao reconhecimento de locutores baseado em QV paramétrica. Os resultados mostram que os algoritmos SOA, SSC, FS-SSC e PCA apresentam~se como altemativas ao tradicional algoritmo LBG (Linde-Buzo-Gray). E investigada a complexidade computacional dos algoritmos SSC e LBG. São obtidas expressões analíticas (em função do tamanho do dicionario, da dimensão dos seus vetores-código, do numero de vetores do conjunto de treino e do numero de iterações desses algoritmos) que estabelecem as condições que devem ser obedecidas para que o algoritmo SSC seja mais eficiente que o algoritmo LBG quanto ao número de operações (divisões, multiplicações, comparações, adições e subtrações) realizadas durante o projeto do dicionario. 0 presente trabalho também apresenta um método para redução da complexidade computacional da etapa de codificação da QV. 0 método proposto utiliza a organização estruturada dos dicionários PCA para reduzir significativamente o numero de operações realizadas na etapa de determinação do vizinho mais próximo de cada vetor a ser codificado bem como para minimizar os requisitos de memória exigida para armazenar o dicionário. |
publishDate |
2001 |
dc.date.none.fl_str_mv |
2001-12-14 2020-01-27T18:00:47Z 2020-01-27 2020-01-27T18:00:47Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/11257 BERNARDINO JUNIOR, Francisco Madeiro. Projeto e avaliação de dicionários para quantização vetorial de voz e imagem. 244f. (Tese) Doutorado em Engenharia Elétrica, Curso de Pós-Graduação em Engenharia Elétrica, Centro de Ciências e Tecnologia e Informática ,Universidade Federal da Paraíba – Campus II - Campina Grande - Paraíba - Brasil, 2001. |
url |
http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/11257 |
identifier_str_mv |
BERNARDINO JUNIOR, Francisco Madeiro. Projeto e avaliação de dicionários para quantização vetorial de voz e imagem. 244f. (Tese) Doutorado em Engenharia Elétrica, Curso de Pós-Graduação em Engenharia Elétrica, Centro de Ciências e Tecnologia e Informática ,Universidade Federal da Paraíba – Campus II - Campina Grande - Paraíba - Brasil, 2001. |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Campina Grande Brasil Centro de Engenharia Elétrica e Informática - CEEI PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA UFCG |
publisher.none.fl_str_mv |
Universidade Federal de Campina Grande Brasil Centro de Engenharia Elétrica e Informática - CEEI PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA UFCG |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UFCG instname:Universidade Federal de Campina Grande (UFCG) instacron:UFCG |
instname_str |
Universidade Federal de Campina Grande (UFCG) |
instacron_str |
UFCG |
institution |
UFCG |
reponame_str |
Biblioteca Digital de Teses e Dissertações da UFCG |
collection |
Biblioteca Digital de Teses e Dissertações da UFCG |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UFCG - Universidade Federal de Campina Grande (UFCG) |
repository.mail.fl_str_mv |
bdtd@setor.ufcg.edu.br || bdtd@setor.ufcg.edu.br |
_version_ |
1809744431062974464 |