Avaliação de desempenho de estruturas de acesso a dados hiperdimensionais

Detalhes bibliográficos
Autor(a) principal: Colossi, Nathan Gevaerd
Data de Publicação: 2000
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
Texto Completo: https://hdl.handle.net/20.500.12733/1608025
Resumo: Orientador: Mario Antonio do Nascimento
id UNICAMP-30_f657da40ae2e3d659596dcbd7a9d1939
oai_identifier_str oai::433817
network_acronym_str UNICAMP-30
network_name_str Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
repository_id_str
spelling Avaliação de desempenho de estruturas de acesso a dados hiperdimensionaisBanco de dadosIndexaçãoEstruturas de dados (Computação)Sistemas multimídiaOrientador: Mario Antonio do NascimentoDissertação (mestrado) - Universidade Estadual de Campinas, Instituto de ComputaçãoResumo: Em bancos de dados multimídia é comum a representação de objetos utilizando vetores de características, que são, por sua vez, mapeados em um espaço multidimensional. Nesta dissertação, os objetos utilizados são imagens, e os vetores de características são obtidos através dos seus histogramas de cores. O mapeamento dos vetores de características em um espaço multidimensional permite a utilização de estruturas de indexação espaciais, proporcionando a realização de consultas de similaridade de forma eficiente. Este trabalho são avaliadas algumas estruturas de indexação para dados multidimen­sionais, que vão de estruturas espaciais tradicionais, como a R-tree e a R* -tree, a estrutu­ras espaciais adaptadas para espaços hiperdimensionais, como a SS-tree e a SR-tree. De fato, este trabalho se concentra no aspecto da alta dimensionalidade dos vetores de ca­racterísticas. Paralelo a estas estruturas, a M-tree, que realiza a indexação dos vetores de características de forma adimensional, i.e., no espaço métrico, é também avaliada. Para completar a avaliação, é feita a comparação dessa estruturas em relação a busca linear, a fim de confirmar a eficiência das estruturas avaliadas. Para assegurar um ambiente de avaliação homogêneo, foi utilizado o ambiente de programação GiST para a implementação das estruturas, e, nas avaliações das estruturas, foi utilizado um conjunto de dados reais de 40.000 elementos. Um conjunto bastante amplo de parâmetros de construção e consulta dos índices permitiu a avaliação das estruturas. Nos resultados obtidos, a SR-tree se mostrou a melhor estrutura com os conjuntos de dados reais. A M-tree mostrou poder alcançar bons resultados, dependendo da técnica de split utilizada. Nesta dissertação são propostas novas técnicas de split sendo uma delas mais robusta em relação ao aumento do número de dimensões. Além desses resultados, é mostrado que o uso de número de páginas acessadas como único indicador de desempenho pode levar a conclusões incorretasAbstract: In multimedia databases its common to represent objects using feature vectors, which are mapped onto a multidimensional space. In this thesis, the objects are image, and their feature vectors are obtained from their color histogram. The feature vectors mapping into a multidimensional space allows the utilization of spatial access structures, in order to efficiently perform similarity queries In this research multidimensional indexing structures are evaluated, from traditional spatial structures, R-tree and R*-tree, up to structures specially designed for high-dimen­sional spaces, like the SS-tree and SR-tree. Indeed, this work focus on the issue of the high-dimensionality of the feature space. Along with these structures, the M-tree, that indexes feature vectors in a non-dimensional manner, i.e., using the metric space, is also evaluated. To complete the evaluation, all the above structures are evaluated against the linear scan, in order to confirm the efficiency of the structures. To assure a homogeneous evaluation environment, the GiST framework was used to implement the structures, and the evaluation was performed using a data set of 40,000 feature vectors. A wide set of parameters was used evaluate construction and query processmg. The results obtained, indicate the SR-tree as the best structure for the real dataset. The M-tree was shown able to obtain good results, depending primarily upon the split technique used. This thesis also proposes new split techniques, and one of them was more resilient with respect to the increase in the number of dimensions. In addition, it is also shown that using the number of accessed pages as the only performance indicator may lead to wrong conclusionsMestradoMestre em Ciência da Computação[s.n.]Nascimento, Mario Antonio do, 1965-Finger, MarceloMedeiros, Claudia Maria BauzerUniversidade Estadual de Campinas (UNICAMP). Instituto de ComputaçãoPrograma de Pós-Graduação em Ciência da ComputaçãoUNIVERSIDADE ESTADUAL DE CAMPINASColossi, Nathan Gevaerd2000info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdf66 p. : il.https://hdl.handle.net/20.500.12733/1608025COLOSSI, Nathan Gevaerd. Avaliação de desempenho de estruturas de acesso a dados hiperdimensionais. 2000. 66 p. Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1608025. Acesso em: 2 set. 2024.https://repositorio.unicamp.br/acervo/detalhe/433817porreponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)instname:Universidade Estadual de Campinas (UNICAMP)instacron:UNICAMPinfo:eu-repo/semantics/openAccess2017-05-30T16:00:31Zoai::433817Biblioteca Digital de Teses e DissertaçõesPUBhttp://repositorio.unicamp.br/oai/tese/oai.aspsbubd@unicamp.bropendoar:2017-05-30T16:00:31Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)false
dc.title.none.fl_str_mv Avaliação de desempenho de estruturas de acesso a dados hiperdimensionais
title Avaliação de desempenho de estruturas de acesso a dados hiperdimensionais
spellingShingle Avaliação de desempenho de estruturas de acesso a dados hiperdimensionais
Colossi, Nathan Gevaerd
Banco de dados
Indexação
Estruturas de dados (Computação)
Sistemas multimídia
title_short Avaliação de desempenho de estruturas de acesso a dados hiperdimensionais
title_full Avaliação de desempenho de estruturas de acesso a dados hiperdimensionais
title_fullStr Avaliação de desempenho de estruturas de acesso a dados hiperdimensionais
title_full_unstemmed Avaliação de desempenho de estruturas de acesso a dados hiperdimensionais
title_sort Avaliação de desempenho de estruturas de acesso a dados hiperdimensionais
author Colossi, Nathan Gevaerd
author_facet Colossi, Nathan Gevaerd
author_role author
dc.contributor.none.fl_str_mv Nascimento, Mario Antonio do, 1965-
Finger, Marcelo
Medeiros, Claudia Maria Bauzer
Universidade Estadual de Campinas (UNICAMP). Instituto de Computação
Programa de Pós-Graduação em Ciência da Computação
UNIVERSIDADE ESTADUAL DE CAMPINAS
dc.contributor.author.fl_str_mv Colossi, Nathan Gevaerd
dc.subject.por.fl_str_mv Banco de dados
Indexação
Estruturas de dados (Computação)
Sistemas multimídia
topic Banco de dados
Indexação
Estruturas de dados (Computação)
Sistemas multimídia
description Orientador: Mario Antonio do Nascimento
publishDate 2000
dc.date.none.fl_str_mv 2000
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://hdl.handle.net/20.500.12733/1608025
COLOSSI, Nathan Gevaerd. Avaliação de desempenho de estruturas de acesso a dados hiperdimensionais. 2000. 66 p. Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1608025. Acesso em: 2 set. 2024.
url https://hdl.handle.net/20.500.12733/1608025
identifier_str_mv COLOSSI, Nathan Gevaerd. Avaliação de desempenho de estruturas de acesso a dados hiperdimensionais. 2000. 66 p. Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1608025. Acesso em: 2 set. 2024.
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv https://repositorio.unicamp.br/acervo/detalhe/433817
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
66 p. : il.
dc.publisher.none.fl_str_mv [s.n.]
publisher.none.fl_str_mv [s.n.]
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
instname:Universidade Estadual de Campinas (UNICAMP)
instacron:UNICAMP
instname_str Universidade Estadual de Campinas (UNICAMP)
instacron_str UNICAMP
institution UNICAMP
reponame_str Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
collection Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)
repository.mail.fl_str_mv sbubd@unicamp.br
_version_ 1809188994290810880