Melhorando o desempenho de métodos de acesso métricos dinâmicos com pivôs adicionais locais e antecipação de informações

Detalhes bibliográficos
Autor(a) principal: Oliveira, Paulo Henrique de
Data de Publicação: 2024
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UEL
Texto Completo: https://repositorio.uel.br/handle/123456789/9157
Resumo: Resumo: Nos últimos anos, o crescimento do volume de dados complexos tem sido acelerado por constantes avanços tecnológicos em dispositivos eletrônicos Neste trabalho, são considerados dados complexos quaisquer dados não representáveis por tipos tradicionais, como números, caracteres, datas e textos curtos Dados multimídia, dados georreferenciados e séries temporais são exemplos dessa categoria de dados A relação de ordem é uma propriedade que permite identificar qual elemento precede o outro, segundo algum critério, em cada par de elementos do domínio Visto que estruturas de indexação tradicionais são baseadas nessa propriedade, elas não são adequadas para dados complexos Entretanto, existem estruturas apropriadas para domínios complexos, como os Métodos de Acesso Métricos (MAMs) Há diversos MAMs relatados na literatura, categorizados de diferentes formas dependendo dos fatores que são levados em conta para estruturar os dados Os fatores tipo de pivô e dinamicidade da estrutura estão diretamente relacionados um ao outro Neste trabalho, pivôs são elementos que agem como representantes de certas regiões do espaço de busca e são usados para podar elementos irrelevantes durante a execução de consultas Diz-se que um pivô é global quando todos os elementos do conjunto de dados são referenciados a ele, enquanto um pivô é local quando somente uma porção do conjunto de dados é referenciada a ele Porque pivôs globais são referenciados por todo o conjunto de dados, eles têm um alto impacto no processo de poda de elementos irrelevantes, uma vez que um único pivô global pode ser usado para descartar uma grande quantidade de elementos irrelevantes No entanto, MAMs baseados em pivôs globais podem ter sua dinamicidade comprometida pelo fato de eventuais atualizações relacionadas a pivôs precisarem ser propagadas por toda a estrutura Pivôs locais, por outro lado, permitem que a manutenção ocorra localmente ao preço de um menor poder de poda Nesse contexto, esta Dissertação teve como alvo melhorar o desempenho de MAMs dinâmicos sem comprometer sua dinamicidade, uma vez que várias aplicações manipulam dados complexos online e, consequentemente, demandam índices dinâmicos e eficientes para serem bem-sucedidas Esta Dissertação apresenta duas técnicas para aumentar o poder de poda de MAMs dinâmicos: (i) usar pivôs adicionais locais para reduzir cálculos de distância e (ii) antecipar informações de nós filhos para reduzir acessos a disco desnecessários Ambas as técnicas foram aplicadas a um MAM dinâmico e avaliadas sobre conjuntos de dados reais, reduzindo o tempo de execução em até mais de 5% para consultas por similaridade sobre conjuntos de dados com dimensionalidades e cardinalidades moderadas e altas
id UEL_7c7988c5fadc4701f2d5675c2254984e
oai_identifier_str oai:repositorio.uel.br:123456789/9157
network_acronym_str UEL
network_name_str Repositório Institucional da UEL
repository_id_str
spelling Melhorando o desempenho de métodos de acesso métricos dinâmicos com pivôs adicionais locais e antecipação de informaçõesBanco de dadosGerênciaEstruturas de dados (Computação)Sistemas multimídiaComputadoresDatabase managementStructures, Data (Computer science)Multimedia systemsComputers - Access controlResumo: Nos últimos anos, o crescimento do volume de dados complexos tem sido acelerado por constantes avanços tecnológicos em dispositivos eletrônicos Neste trabalho, são considerados dados complexos quaisquer dados não representáveis por tipos tradicionais, como números, caracteres, datas e textos curtos Dados multimídia, dados georreferenciados e séries temporais são exemplos dessa categoria de dados A relação de ordem é uma propriedade que permite identificar qual elemento precede o outro, segundo algum critério, em cada par de elementos do domínio Visto que estruturas de indexação tradicionais são baseadas nessa propriedade, elas não são adequadas para dados complexos Entretanto, existem estruturas apropriadas para domínios complexos, como os Métodos de Acesso Métricos (MAMs) Há diversos MAMs relatados na literatura, categorizados de diferentes formas dependendo dos fatores que são levados em conta para estruturar os dados Os fatores tipo de pivô e dinamicidade da estrutura estão diretamente relacionados um ao outro Neste trabalho, pivôs são elementos que agem como representantes de certas regiões do espaço de busca e são usados para podar elementos irrelevantes durante a execução de consultas Diz-se que um pivô é global quando todos os elementos do conjunto de dados são referenciados a ele, enquanto um pivô é local quando somente uma porção do conjunto de dados é referenciada a ele Porque pivôs globais são referenciados por todo o conjunto de dados, eles têm um alto impacto no processo de poda de elementos irrelevantes, uma vez que um único pivô global pode ser usado para descartar uma grande quantidade de elementos irrelevantes No entanto, MAMs baseados em pivôs globais podem ter sua dinamicidade comprometida pelo fato de eventuais atualizações relacionadas a pivôs precisarem ser propagadas por toda a estrutura Pivôs locais, por outro lado, permitem que a manutenção ocorra localmente ao preço de um menor poder de poda Nesse contexto, esta Dissertação teve como alvo melhorar o desempenho de MAMs dinâmicos sem comprometer sua dinamicidade, uma vez que várias aplicações manipulam dados complexos online e, consequentemente, demandam índices dinâmicos e eficientes para serem bem-sucedidas Esta Dissertação apresenta duas técnicas para aumentar o poder de poda de MAMs dinâmicos: (i) usar pivôs adicionais locais para reduzir cálculos de distância e (ii) antecipar informações de nós filhos para reduzir acessos a disco desnecessários Ambas as técnicas foram aplicadas a um MAM dinâmico e avaliadas sobre conjuntos de dados reais, reduzindo o tempo de execução em até mais de 5% para consultas por similaridade sobre conjuntos de dados com dimensionalidades e cardinalidades moderadas e altasDissertação (Mestrado em Ciência da Computação) - Universidade Estadual de Londrina, Centro de Ciências Exatas, Programa de Pós-Graduação em Ciência da ComputaçãoAbstract: In recent years, the growth of complex data has been accelerated by constant technological advances in electronic devices In this work, complex data are considered as any data not representable by traditional types, such as numbers, characters, dates and short texts Multimedia data, georeferenced data and time series are examples of this category of data The order relation is a property that allows identifying which element precedes the other, according to some criterion, in each pair of elements of the domain Since traditional index structures are based on this property, they are not suitable for complex data Nevertheless, there are structures well-suited for complex domains, such as the Metric Access Methods (MAMs) There are several MAMs related in the literature, categorized in different ways depending on which factors are taken into account to structure the data The factors pivot type and structure dynamicity are directly related to each other In this work, pivots are elements that act as representatives of certain regions of the search space and are employed to prune irrelevant elements during the query execution It is said that a pivot is global when all elements of the dataset are referenced to it, whereas a pivot is local when only a portion of the dataset is referenced to it Because global pivots are referenced by the whole dataset, they have a high impact in the pruning process of irrelevant elements, once that a single global pivot can be used to discard a large amount of irrelevant elements However, MAMs based on global pivots may have their dynamicity compromised by the fact that eventual pivot-related updates need to be propagated through the entire structure Local pivots, on the other hand, allow the maintenance to occur locally at the price of a lower pruning ability In this context, this dissertation aimed at improving the performance of dynamic MAMs without harming their dynamicity, once that several applications handle online complex data and, consequently, demand efficient dynamic indexes to be successful This dissertation presents two techniques for improving the pruning ability of dynamic MAMs: (i) using local additional pivots to reduce distance calculations and (ii) anticipating information from child nodes to reduce unnecessary disk accesses Both techniques have been applied to a dynamic MAM and evaluated over real datasets, reducing execution time in up to more than 5% for similarity queries posed on datasets ranging from moderate to high dimensionality and cardinalityKaster, Daniel dos Santos [Orientador]Razente, Humberto LuizBonifácio, Adilson LuizBrancher, Jacques DuílioOliveira, Paulo Henrique de2024-05-01T11:49:45Z2024-05-01T11:49:45Z2015.0028.07.2015info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://repositorio.uel.br/handle/123456789/9157porMestradoCiência da ComputaçãoCentro de Ciências ExatasPrograma de Pós-Graduação em Ciência da ComputaçãoLondrinareponame:Repositório Institucional da UELinstname:Universidade Estadual de Londrina (UEL)instacron:UELinfo:eu-repo/semantics/openAccess2024-07-12T04:19:41Zoai:repositorio.uel.br:123456789/9157Biblioteca Digital de Teses e Dissertaçõeshttp://www.bibliotecadigital.uel.br/PUBhttp://www.bibliotecadigital.uel.br/OAI/oai2.phpbcuel@uel.br||opendoar:2024-07-12T04:19:41Repositório Institucional da UEL - Universidade Estadual de Londrina (UEL)false
dc.title.none.fl_str_mv Melhorando o desempenho de métodos de acesso métricos dinâmicos com pivôs adicionais locais e antecipação de informações
title Melhorando o desempenho de métodos de acesso métricos dinâmicos com pivôs adicionais locais e antecipação de informações
spellingShingle Melhorando o desempenho de métodos de acesso métricos dinâmicos com pivôs adicionais locais e antecipação de informações
Oliveira, Paulo Henrique de
Banco de dados
Gerência
Estruturas de dados (Computação)
Sistemas multimídia
Computadores
Database management
Structures, Data (Computer science)
Multimedia systems
Computers - Access control
title_short Melhorando o desempenho de métodos de acesso métricos dinâmicos com pivôs adicionais locais e antecipação de informações
title_full Melhorando o desempenho de métodos de acesso métricos dinâmicos com pivôs adicionais locais e antecipação de informações
title_fullStr Melhorando o desempenho de métodos de acesso métricos dinâmicos com pivôs adicionais locais e antecipação de informações
title_full_unstemmed Melhorando o desempenho de métodos de acesso métricos dinâmicos com pivôs adicionais locais e antecipação de informações
title_sort Melhorando o desempenho de métodos de acesso métricos dinâmicos com pivôs adicionais locais e antecipação de informações
author Oliveira, Paulo Henrique de
author_facet Oliveira, Paulo Henrique de
author_role author
dc.contributor.none.fl_str_mv Kaster, Daniel dos Santos [Orientador]
Razente, Humberto Luiz
Bonifácio, Adilson Luiz
Brancher, Jacques Duílio
dc.contributor.author.fl_str_mv Oliveira, Paulo Henrique de
dc.subject.por.fl_str_mv Banco de dados
Gerência
Estruturas de dados (Computação)
Sistemas multimídia
Computadores
Database management
Structures, Data (Computer science)
Multimedia systems
Computers - Access control
topic Banco de dados
Gerência
Estruturas de dados (Computação)
Sistemas multimídia
Computadores
Database management
Structures, Data (Computer science)
Multimedia systems
Computers - Access control
description Resumo: Nos últimos anos, o crescimento do volume de dados complexos tem sido acelerado por constantes avanços tecnológicos em dispositivos eletrônicos Neste trabalho, são considerados dados complexos quaisquer dados não representáveis por tipos tradicionais, como números, caracteres, datas e textos curtos Dados multimídia, dados georreferenciados e séries temporais são exemplos dessa categoria de dados A relação de ordem é uma propriedade que permite identificar qual elemento precede o outro, segundo algum critério, em cada par de elementos do domínio Visto que estruturas de indexação tradicionais são baseadas nessa propriedade, elas não são adequadas para dados complexos Entretanto, existem estruturas apropriadas para domínios complexos, como os Métodos de Acesso Métricos (MAMs) Há diversos MAMs relatados na literatura, categorizados de diferentes formas dependendo dos fatores que são levados em conta para estruturar os dados Os fatores tipo de pivô e dinamicidade da estrutura estão diretamente relacionados um ao outro Neste trabalho, pivôs são elementos que agem como representantes de certas regiões do espaço de busca e são usados para podar elementos irrelevantes durante a execução de consultas Diz-se que um pivô é global quando todos os elementos do conjunto de dados são referenciados a ele, enquanto um pivô é local quando somente uma porção do conjunto de dados é referenciada a ele Porque pivôs globais são referenciados por todo o conjunto de dados, eles têm um alto impacto no processo de poda de elementos irrelevantes, uma vez que um único pivô global pode ser usado para descartar uma grande quantidade de elementos irrelevantes No entanto, MAMs baseados em pivôs globais podem ter sua dinamicidade comprometida pelo fato de eventuais atualizações relacionadas a pivôs precisarem ser propagadas por toda a estrutura Pivôs locais, por outro lado, permitem que a manutenção ocorra localmente ao preço de um menor poder de poda Nesse contexto, esta Dissertação teve como alvo melhorar o desempenho de MAMs dinâmicos sem comprometer sua dinamicidade, uma vez que várias aplicações manipulam dados complexos online e, consequentemente, demandam índices dinâmicos e eficientes para serem bem-sucedidas Esta Dissertação apresenta duas técnicas para aumentar o poder de poda de MAMs dinâmicos: (i) usar pivôs adicionais locais para reduzir cálculos de distância e (ii) antecipar informações de nós filhos para reduzir acessos a disco desnecessários Ambas as técnicas foram aplicadas a um MAM dinâmico e avaliadas sobre conjuntos de dados reais, reduzindo o tempo de execução em até mais de 5% para consultas por similaridade sobre conjuntos de dados com dimensionalidades e cardinalidades moderadas e altas
publishDate 2024
dc.date.none.fl_str_mv 2015.00
2024-05-01T11:49:45Z
2024-05-01T11:49:45Z
28.07.2015
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.uel.br/handle/123456789/9157
url https://repositorio.uel.br/handle/123456789/9157
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv Mestrado
Ciência da Computação
Centro de Ciências Exatas
Programa de Pós-Graduação em Ciência da Computação
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv Londrina
dc.source.none.fl_str_mv reponame:Repositório Institucional da UEL
instname:Universidade Estadual de Londrina (UEL)
instacron:UEL
instname_str Universidade Estadual de Londrina (UEL)
instacron_str UEL
institution UEL
reponame_str Repositório Institucional da UEL
collection Repositório Institucional da UEL
repository.name.fl_str_mv Repositório Institucional da UEL - Universidade Estadual de Londrina (UEL)
repository.mail.fl_str_mv bcuel@uel.br||
_version_ 1809823247071444992