Redução de dimensionalidade usando agrupamento e discretização ponderada para a recuperação de imagens por conteúdo

Detalhes bibliográficos
Autor(a) principal: Pirolla, Francisco Rocha
Data de Publicação: 2012
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFSCAR
Texto Completo: https://repositorio.ufscar.br/handle/ufscar/511
Resumo: This work proposes two new techniques of feature vector pre-processing to improve CBIR and image classification systems: a method of feature transformation based on the k-means clustering approach (Feature Transformation based on K-means - FTK) and a method of Weighted Feature Discretization - WFD. The FTK method employs the clustering principle of k-means to compact the feature vector space. The WFD method performs a weighted feature discretization, privileging the most important feature ranges to distinguish images. The proposed methods were employed to pre-process the feature vector in CBIR and in classification approaches, comparing the results with the pre-processing performed by PCA (a well known feature transformation method) and the original feature vector: FTK produced a reduction in the feature vector size with an improving in the query precision and a improvement in the classification accuracy; WFD improved the query precision up to and a improvement in the classification accuracy; the combination of WFD and FTK improved also the query precision and a improvement in the classification accuracy. These are very important results, especially when compared with PCA results, which leads to a minor reduction in the feature vector size, a minor increase in the query precision and a minor increase in the classification accuracy. Also the proposed approaches have linear computational cost where PCA has a cubic computational cost. The results indicate that the proposed approaches are well-suited to perform image feature vector pre-processing improving the overall quality of CBIR and classification systems.
id SCAR_7f94297020f165412a255daf5716fdb2
oai_identifier_str oai:repositorio.ufscar.br:ufscar/511
network_acronym_str SCAR
network_name_str Repositório Institucional da UFSCAR
repository_id_str 4322
spelling Pirolla, Francisco RochaRibeiro, Marcela Xavierhttp://genos.cnpq.br:12010/dwlattes/owa/prc_imp_cv_int?f_cod=K4766919E1http://lattes.cnpq.br/96753226028594516826e1b4-6267-437b-b946-4d1cb0facd7e2016-06-02T19:06:00Z2012-12-192016-06-02T19:06:00Z2012-11-19PIROLLA, Francisco Rocha. Redução de dimensionalidade usando agrupamento e discretização ponderada para a recuperação de imagens por conteúdo. 2012. 75 f. Dissertação (Mestrado em Ciências Exatas e da Terra) - Universidade Federal de São Carlos, São Carlos, 2012.https://repositorio.ufscar.br/handle/ufscar/511This work proposes two new techniques of feature vector pre-processing to improve CBIR and image classification systems: a method of feature transformation based on the k-means clustering approach (Feature Transformation based on K-means - FTK) and a method of Weighted Feature Discretization - WFD. The FTK method employs the clustering principle of k-means to compact the feature vector space. The WFD method performs a weighted feature discretization, privileging the most important feature ranges to distinguish images. The proposed methods were employed to pre-process the feature vector in CBIR and in classification approaches, comparing the results with the pre-processing performed by PCA (a well known feature transformation method) and the original feature vector: FTK produced a reduction in the feature vector size with an improving in the query precision and a improvement in the classification accuracy; WFD improved the query precision up to and a improvement in the classification accuracy; the combination of WFD and FTK improved also the query precision and a improvement in the classification accuracy. These are very important results, especially when compared with PCA results, which leads to a minor reduction in the feature vector size, a minor increase in the query precision and a minor increase in the classification accuracy. Also the proposed approaches have linear computational cost where PCA has a cubic computational cost. The results indicate that the proposed approaches are well-suited to perform image feature vector pre-processing improving the overall quality of CBIR and classification systems.Neste trabalho, propomos diminuir o gap semântico e os problemas de maldição de dimensionalidade apresentando duas técnicas de préprocessamento do vetor de características com o objetivo de melhorar a recuperação de imagens baseada em conteúdo e sistemas de classificação de imagens: um método de redução de dimensionalidade do vetor de características original, baseado no algoritmo k-means, chamado FTK (Feature Transformation based on K-means) e um método de discretização ponderada de características que privilegia as faixas de características mais importantes para distinguir imagens, chamado WFD (Weighted Feature Discretization). Os métodos propostos foram utilizados para pré-processar os vetores de características nas abordagens CBIR e classificação, comparando o pré-processamento executado pelo método PCA e os resultados dos vetores de características originais. O algoritmo FTK promoveu uma redução no tamanho do vetor de características com uma melhoria na precisão da consulta e na precisão de classificação. O algoritmo WFD melhorou a precisão da consulta e classificação; a combinação de dos dois algoritmos propostos também melhorou a precisão da consulta e classificação. Estes resultados são muito importantes, especialmente quando comparados com os resultados do método PCA, que também leva a uma redução no tamanho do vetor de características, a um menor aumento na precisão da consulta e a menor aumento na precisão da classificação. Além disso, as técnicas propostas têm custo computacional linear, enquanto o PCA tem um custo computacional cúbico. Os resultados indicam que os métodos propostos são abordagens adequadas para realizar pré-processamento dos vetores de características de imagens em sistemas CBIR e em sistemas de classificação.Universidade Federal de Sao Carlosapplication/pdfporUniversidade Federal de São CarlosPrograma de Pós-Graduação em Ciência da Computação - PPGCCUFSCarBRProcessamento de imagensDiscretizaçãoPréprocessamentoCBIRTransformação de característicasVetor de característicasAgrupamentoClassificaçãoFeature transformationDiscretizationPre-processingFeature vectorClusteringCBIRClassificationCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAORedução de dimensionalidade usando agrupamento e discretização ponderada para a recuperação de imagens por conteúdoinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis-1-104d8be23-7330-4147-baf0-14545dd9cbdfinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARORIGINAL4756.pdfapplication/pdf1515606https://repositorio.ufscar.br/bitstream/ufscar/511/1/4756.pdf12146689055c9826f258e527c3ae001aMD51TEXT4756.pdf.txt4756.pdf.txtExtracted texttext/plain0https://repositorio.ufscar.br/bitstream/ufscar/511/2/4756.pdf.txtd41d8cd98f00b204e9800998ecf8427eMD52THUMBNAIL4756.pdf.jpg4756.pdf.jpgIM Thumbnailimage/jpeg8840https://repositorio.ufscar.br/bitstream/ufscar/511/3/4756.pdf.jpg0a3069754a5d0c020c8cfd1962abcc31MD53ufscar/5112023-09-18 18:31:27.419oai:repositorio.ufscar.br:ufscar/511Repositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestopendoar:43222023-09-18T18:31:27Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false
dc.title.por.fl_str_mv Redução de dimensionalidade usando agrupamento e discretização ponderada para a recuperação de imagens por conteúdo
title Redução de dimensionalidade usando agrupamento e discretização ponderada para a recuperação de imagens por conteúdo
spellingShingle Redução de dimensionalidade usando agrupamento e discretização ponderada para a recuperação de imagens por conteúdo
Pirolla, Francisco Rocha
Processamento de imagens
Discretização
Préprocessamento
CBIR
Transformação de características
Vetor de características
Agrupamento
Classificação
Feature transformation
Discretization
Pre-processing
Feature vector
Clustering
CBIR
Classification
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
title_short Redução de dimensionalidade usando agrupamento e discretização ponderada para a recuperação de imagens por conteúdo
title_full Redução de dimensionalidade usando agrupamento e discretização ponderada para a recuperação de imagens por conteúdo
title_fullStr Redução de dimensionalidade usando agrupamento e discretização ponderada para a recuperação de imagens por conteúdo
title_full_unstemmed Redução de dimensionalidade usando agrupamento e discretização ponderada para a recuperação de imagens por conteúdo
title_sort Redução de dimensionalidade usando agrupamento e discretização ponderada para a recuperação de imagens por conteúdo
author Pirolla, Francisco Rocha
author_facet Pirolla, Francisco Rocha
author_role author
dc.contributor.authorlattes.por.fl_str_mv http://lattes.cnpq.br/9675322602859451
dc.contributor.author.fl_str_mv Pirolla, Francisco Rocha
dc.contributor.advisor1.fl_str_mv Ribeiro, Marcela Xavier
dc.contributor.advisor1Lattes.fl_str_mv http://genos.cnpq.br:12010/dwlattes/owa/prc_imp_cv_int?f_cod=K4766919E1
dc.contributor.authorID.fl_str_mv 6826e1b4-6267-437b-b946-4d1cb0facd7e
contributor_str_mv Ribeiro, Marcela Xavier
dc.subject.por.fl_str_mv Processamento de imagens
Discretização
Préprocessamento
CBIR
Transformação de características
Vetor de características
Agrupamento
Classificação
topic Processamento de imagens
Discretização
Préprocessamento
CBIR
Transformação de características
Vetor de características
Agrupamento
Classificação
Feature transformation
Discretization
Pre-processing
Feature vector
Clustering
CBIR
Classification
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
dc.subject.eng.fl_str_mv Feature transformation
Discretization
Pre-processing
Feature vector
Clustering
CBIR
Classification
dc.subject.cnpq.fl_str_mv CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
description This work proposes two new techniques of feature vector pre-processing to improve CBIR and image classification systems: a method of feature transformation based on the k-means clustering approach (Feature Transformation based on K-means - FTK) and a method of Weighted Feature Discretization - WFD. The FTK method employs the clustering principle of k-means to compact the feature vector space. The WFD method performs a weighted feature discretization, privileging the most important feature ranges to distinguish images. The proposed methods were employed to pre-process the feature vector in CBIR and in classification approaches, comparing the results with the pre-processing performed by PCA (a well known feature transformation method) and the original feature vector: FTK produced a reduction in the feature vector size with an improving in the query precision and a improvement in the classification accuracy; WFD improved the query precision up to and a improvement in the classification accuracy; the combination of WFD and FTK improved also the query precision and a improvement in the classification accuracy. These are very important results, especially when compared with PCA results, which leads to a minor reduction in the feature vector size, a minor increase in the query precision and a minor increase in the classification accuracy. Also the proposed approaches have linear computational cost where PCA has a cubic computational cost. The results indicate that the proposed approaches are well-suited to perform image feature vector pre-processing improving the overall quality of CBIR and classification systems.
publishDate 2012
dc.date.available.fl_str_mv 2012-12-19
2016-06-02T19:06:00Z
dc.date.issued.fl_str_mv 2012-11-19
dc.date.accessioned.fl_str_mv 2016-06-02T19:06:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv PIROLLA, Francisco Rocha. Redução de dimensionalidade usando agrupamento e discretização ponderada para a recuperação de imagens por conteúdo. 2012. 75 f. Dissertação (Mestrado em Ciências Exatas e da Terra) - Universidade Federal de São Carlos, São Carlos, 2012.
dc.identifier.uri.fl_str_mv https://repositorio.ufscar.br/handle/ufscar/511
identifier_str_mv PIROLLA, Francisco Rocha. Redução de dimensionalidade usando agrupamento e discretização ponderada para a recuperação de imagens por conteúdo. 2012. 75 f. Dissertação (Mestrado em Ciências Exatas e da Terra) - Universidade Federal de São Carlos, São Carlos, 2012.
url https://repositorio.ufscar.br/handle/ufscar/511
dc.language.iso.fl_str_mv por
language por
dc.relation.confidence.fl_str_mv -1
-1
dc.relation.authority.fl_str_mv 04d8be23-7330-4147-baf0-14545dd9cbdf
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal de São Carlos
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Ciência da Computação - PPGCC
dc.publisher.initials.fl_str_mv UFSCar
dc.publisher.country.fl_str_mv BR
publisher.none.fl_str_mv Universidade Federal de São Carlos
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSCAR
instname:Universidade Federal de São Carlos (UFSCAR)
instacron:UFSCAR
instname_str Universidade Federal de São Carlos (UFSCAR)
instacron_str UFSCAR
institution UFSCAR
reponame_str Repositório Institucional da UFSCAR
collection Repositório Institucional da UFSCAR
bitstream.url.fl_str_mv https://repositorio.ufscar.br/bitstream/ufscar/511/1/4756.pdf
https://repositorio.ufscar.br/bitstream/ufscar/511/2/4756.pdf.txt
https://repositorio.ufscar.br/bitstream/ufscar/511/3/4756.pdf.jpg
bitstream.checksum.fl_str_mv 12146689055c9826f258e527c3ae001a
d41d8cd98f00b204e9800998ecf8427e
0a3069754a5d0c020c8cfd1962abcc31
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)
repository.mail.fl_str_mv
_version_ 1813715503394324480