Avaliação de desempenho de estruturas de acesso a dados hiperdimensionais
Autor(a) principal: | |
---|---|
Data de Publicação: | 2000 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
Texto Completo: | https://hdl.handle.net/20.500.12733/1608025 |
Resumo: | Orientador: Mario Antonio do Nascimento |
id |
UNICAMP-30_f657da40ae2e3d659596dcbd7a9d1939 |
---|---|
oai_identifier_str |
oai::433817 |
network_acronym_str |
UNICAMP-30 |
network_name_str |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
repository_id_str |
|
spelling |
Avaliação de desempenho de estruturas de acesso a dados hiperdimensionaisBanco de dadosIndexaçãoEstruturas de dados (Computação)Sistemas multimídiaOrientador: Mario Antonio do NascimentoDissertação (mestrado) - Universidade Estadual de Campinas, Instituto de ComputaçãoResumo: Em bancos de dados multimídia é comum a representação de objetos utilizando vetores de características, que são, por sua vez, mapeados em um espaço multidimensional. Nesta dissertação, os objetos utilizados são imagens, e os vetores de características são obtidos através dos seus histogramas de cores. O mapeamento dos vetores de características em um espaço multidimensional permite a utilização de estruturas de indexação espaciais, proporcionando a realização de consultas de similaridade de forma eficiente. Este trabalho são avaliadas algumas estruturas de indexação para dados multidimensionais, que vão de estruturas espaciais tradicionais, como a R-tree e a R* -tree, a estruturas espaciais adaptadas para espaços hiperdimensionais, como a SS-tree e a SR-tree. De fato, este trabalho se concentra no aspecto da alta dimensionalidade dos vetores de características. Paralelo a estas estruturas, a M-tree, que realiza a indexação dos vetores de características de forma adimensional, i.e., no espaço métrico, é também avaliada. Para completar a avaliação, é feita a comparação dessa estruturas em relação a busca linear, a fim de confirmar a eficiência das estruturas avaliadas. Para assegurar um ambiente de avaliação homogêneo, foi utilizado o ambiente de programação GiST para a implementação das estruturas, e, nas avaliações das estruturas, foi utilizado um conjunto de dados reais de 40.000 elementos. Um conjunto bastante amplo de parâmetros de construção e consulta dos índices permitiu a avaliação das estruturas. Nos resultados obtidos, a SR-tree se mostrou a melhor estrutura com os conjuntos de dados reais. A M-tree mostrou poder alcançar bons resultados, dependendo da técnica de split utilizada. Nesta dissertação são propostas novas técnicas de split sendo uma delas mais robusta em relação ao aumento do número de dimensões. Além desses resultados, é mostrado que o uso de número de páginas acessadas como único indicador de desempenho pode levar a conclusões incorretasAbstract: In multimedia databases its common to represent objects using feature vectors, which are mapped onto a multidimensional space. In this thesis, the objects are image, and their feature vectors are obtained from their color histogram. The feature vectors mapping into a multidimensional space allows the utilization of spatial access structures, in order to efficiently perform similarity queries In this research multidimensional indexing structures are evaluated, from traditional spatial structures, R-tree and R*-tree, up to structures specially designed for high-dimensional spaces, like the SS-tree and SR-tree. Indeed, this work focus on the issue of the high-dimensionality of the feature space. Along with these structures, the M-tree, that indexes feature vectors in a non-dimensional manner, i.e., using the metric space, is also evaluated. To complete the evaluation, all the above structures are evaluated against the linear scan, in order to confirm the efficiency of the structures. To assure a homogeneous evaluation environment, the GiST framework was used to implement the structures, and the evaluation was performed using a data set of 40,000 feature vectors. A wide set of parameters was used evaluate construction and query processmg. The results obtained, indicate the SR-tree as the best structure for the real dataset. The M-tree was shown able to obtain good results, depending primarily upon the split technique used. This thesis also proposes new split techniques, and one of them was more resilient with respect to the increase in the number of dimensions. In addition, it is also shown that using the number of accessed pages as the only performance indicator may lead to wrong conclusionsMestradoMestre em Ciência da Computação[s.n.]Nascimento, Mario Antonio do, 1965-Finger, MarceloMedeiros, Claudia Maria BauzerUniversidade Estadual de Campinas (UNICAMP). Instituto de ComputaçãoPrograma de Pós-Graduação em Ciência da ComputaçãoUNIVERSIDADE ESTADUAL DE CAMPINASColossi, Nathan Gevaerd2000info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdf66 p. : il.https://hdl.handle.net/20.500.12733/1608025COLOSSI, Nathan Gevaerd. Avaliação de desempenho de estruturas de acesso a dados hiperdimensionais. 2000. 66 p. Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1608025. Acesso em: 2 set. 2024.https://repositorio.unicamp.br/acervo/detalhe/433817porreponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)instname:Universidade Estadual de Campinas (UNICAMP)instacron:UNICAMPinfo:eu-repo/semantics/openAccess2017-05-30T16:00:31Zoai::433817Biblioteca Digital de Teses e DissertaçõesPUBhttp://repositorio.unicamp.br/oai/tese/oai.aspsbubd@unicamp.bropendoar:2017-05-30T16:00:31Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)false |
dc.title.none.fl_str_mv |
Avaliação de desempenho de estruturas de acesso a dados hiperdimensionais |
title |
Avaliação de desempenho de estruturas de acesso a dados hiperdimensionais |
spellingShingle |
Avaliação de desempenho de estruturas de acesso a dados hiperdimensionais Colossi, Nathan Gevaerd Banco de dados Indexação Estruturas de dados (Computação) Sistemas multimídia |
title_short |
Avaliação de desempenho de estruturas de acesso a dados hiperdimensionais |
title_full |
Avaliação de desempenho de estruturas de acesso a dados hiperdimensionais |
title_fullStr |
Avaliação de desempenho de estruturas de acesso a dados hiperdimensionais |
title_full_unstemmed |
Avaliação de desempenho de estruturas de acesso a dados hiperdimensionais |
title_sort |
Avaliação de desempenho de estruturas de acesso a dados hiperdimensionais |
author |
Colossi, Nathan Gevaerd |
author_facet |
Colossi, Nathan Gevaerd |
author_role |
author |
dc.contributor.none.fl_str_mv |
Nascimento, Mario Antonio do, 1965- Finger, Marcelo Medeiros, Claudia Maria Bauzer Universidade Estadual de Campinas (UNICAMP). Instituto de Computação Programa de Pós-Graduação em Ciência da Computação UNIVERSIDADE ESTADUAL DE CAMPINAS |
dc.contributor.author.fl_str_mv |
Colossi, Nathan Gevaerd |
dc.subject.por.fl_str_mv |
Banco de dados Indexação Estruturas de dados (Computação) Sistemas multimídia |
topic |
Banco de dados Indexação Estruturas de dados (Computação) Sistemas multimídia |
description |
Orientador: Mario Antonio do Nascimento |
publishDate |
2000 |
dc.date.none.fl_str_mv |
2000 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://hdl.handle.net/20.500.12733/1608025 COLOSSI, Nathan Gevaerd. Avaliação de desempenho de estruturas de acesso a dados hiperdimensionais. 2000. 66 p. Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1608025. Acesso em: 2 set. 2024. |
url |
https://hdl.handle.net/20.500.12733/1608025 |
identifier_str_mv |
COLOSSI, Nathan Gevaerd. Avaliação de desempenho de estruturas de acesso a dados hiperdimensionais. 2000. 66 p. Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1608025. Acesso em: 2 set. 2024. |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
https://repositorio.unicamp.br/acervo/detalhe/433817 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf 66 p. : il. |
dc.publisher.none.fl_str_mv |
[s.n.] |
publisher.none.fl_str_mv |
[s.n.] |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) instname:Universidade Estadual de Campinas (UNICAMP) instacron:UNICAMP |
instname_str |
Universidade Estadual de Campinas (UNICAMP) |
instacron_str |
UNICAMP |
institution |
UNICAMP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
collection |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP) |
repository.mail.fl_str_mv |
sbubd@unicamp.br |
_version_ |
1809188994290810880 |