A distributed workflow-based architecture for content-based image retrieval

Detalhes bibliográficos
Autor(a) principal: Oliveira, Luis Fernando Milano
Data de Publicação: 2024
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UEL
Texto Completo: https://repositorio.uel.br/handle/123456789/10033
Resumo: Resumo: O aumento de conjunto de dados é um dos desafios que devem ser superados por sistemas de gerenciamento de dados, uma vez que usuários geram muita informação diariamente Contudo, apenas armazenar esses dados não é suficiente Também é necessário que sejam fornecidas maneiras de se recuperar informação relevante dentro desse oceano de dados Dados complexos – como imagens, vídeos, e dados espaciais – ainda adicionam outro desafio, na medida em que eles exigem técnicas de recuperação específicas, como buscas por simaridade Neste trabalho, nossa primeira preocupação é fornecer métodos que permitam a usuários incluir seu conhecimento de domínio para construir uma representação desses dados complexos que se assemelha à suas noções de similaridade, o que chamamos de espaços de similaridade Assim que um espaço de similaridade é definido, nós também fornecemos mecanismos para a realização eficiente de buscas de dados complexos Nossas contribuições são: uma arquitetura distribuída que permite a definição de espaços de similaridade através de workflows científicos; e (ii) uma abordagem de consulta a espaços de similaridade em ambientes distribuídos Essa segunda abordagem permite que virtualmente qualquer método de acesso métrico seja usado como um plugin para a arquitetura, delegando a eles a responsabilidade por tarefas de indexação, poda e processamento de consultas, o que permite que índices centralizados sejam executados em ambientes distribuídos As abordagens foram implementadas em um framework e através de uma avaliação foi possível alcançar um speedup linear em atividades de definição de espaços de similaridade, enquanto a performance em buscas por similaridade foi de até 24 vezes melhor quando comparada a um método sequencial
id UEL_8635bb05a791300711a74c45a80b6af5
oai_identifier_str oai:repositorio.uel.br:123456789/10033
network_acronym_str UEL
network_name_str Repositório Institucional da UEL
repository_id_str
spelling A distributed workflow-based architecture for content-based image retrievalFluxo de trabalhoSimilaridade (Física)Computação distribuídaImagensWorkflowSimilarity (Physics)Distributed computationImagesResumo: O aumento de conjunto de dados é um dos desafios que devem ser superados por sistemas de gerenciamento de dados, uma vez que usuários geram muita informação diariamente Contudo, apenas armazenar esses dados não é suficiente Também é necessário que sejam fornecidas maneiras de se recuperar informação relevante dentro desse oceano de dados Dados complexos – como imagens, vídeos, e dados espaciais – ainda adicionam outro desafio, na medida em que eles exigem técnicas de recuperação específicas, como buscas por simaridade Neste trabalho, nossa primeira preocupação é fornecer métodos que permitam a usuários incluir seu conhecimento de domínio para construir uma representação desses dados complexos que se assemelha à suas noções de similaridade, o que chamamos de espaços de similaridade Assim que um espaço de similaridade é definido, nós também fornecemos mecanismos para a realização eficiente de buscas de dados complexos Nossas contribuições são: uma arquitetura distribuída que permite a definição de espaços de similaridade através de workflows científicos; e (ii) uma abordagem de consulta a espaços de similaridade em ambientes distribuídos Essa segunda abordagem permite que virtualmente qualquer método de acesso métrico seja usado como um plugin para a arquitetura, delegando a eles a responsabilidade por tarefas de indexação, poda e processamento de consultas, o que permite que índices centralizados sejam executados em ambientes distribuídos As abordagens foram implementadas em um framework e através de uma avaliação foi possível alcançar um speedup linear em atividades de definição de espaços de similaridade, enquanto a performance em buscas por similaridade foi de até 24 vezes melhor quando comparada a um método sequencialDissertação (Mestrado em Ciência da Computação) - Universidade Estadual de Londrina, Centro de Ciências Exatas, Programa de Pós-Graduação em Ciência da ComputaçãoAbstract: The increasing size of datasets imposes a challenge for data management systems, as people produce tons of information everyday Not only data should be stored, but ways of fetching relevant information among in this flood of data are also in demand Complex data, such as images, videos, and spatial data, bring an even harder challenge since they require specific retrieval techniques, such as similarity search In this work, our first concern is to provide methods that allow users to embed their domain knowledge to build a representation of complex data that resembles their notion of similarity, which we call similarity space Once a similarity space is defined, we also aim at providing ways for efficient distributed similarity search in datasets that are too big for being processed by centralized approaches Our contributions are: (i) a distributed architecture that allows the definition of similarity spaces through scientific workflows; and (ii) an approach for querying similarity spaces in distributed environments This search mechanism allows virtually any metric access method to be used as a plugin to the architecture, delegating to them the responsibility of indexing, pruning, and query processing tasks, which enables centralized indexes to be run in distributed environments We evaluated our approaches implemented in a framework and were able to achieve linear speedup in similarity space definition activities while up to 24 times faster similarity searches when compared to a baseline sequential methodKaster, Daniel dos Santos [Orientador]Bugatti, Pedro HenriqueBarbon Junior, SylvioOliveira, Luis Fernando Milano2024-05-01T12:13:34Z2024-05-01T12:13:34Z2018.0027.04.2018info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://repositorio.uel.br/handle/123456789/10033porMestradoCiência da ComputaçãoCentro de Ciências ExatasPrograma de Pós-Graduação em Ciência da ComputaçãoLondrinareponame:Repositório Institucional da UELinstname:Universidade Estadual de Londrina (UEL)instacron:UELinfo:eu-repo/semantics/openAccess2024-07-12T04:19:59Zoai:repositorio.uel.br:123456789/10033Biblioteca Digital de Teses e Dissertaçõeshttp://www.bibliotecadigital.uel.br/PUBhttp://www.bibliotecadigital.uel.br/OAI/oai2.phpbcuel@uel.br||opendoar:2024-07-12T04:19:59Repositório Institucional da UEL - Universidade Estadual de Londrina (UEL)false
dc.title.none.fl_str_mv A distributed workflow-based architecture for content-based image retrieval
title A distributed workflow-based architecture for content-based image retrieval
spellingShingle A distributed workflow-based architecture for content-based image retrieval
Oliveira, Luis Fernando Milano
Fluxo de trabalho
Similaridade (Física)
Computação distribuída
Imagens
Workflow
Similarity (Physics)
Distributed computation
Images
title_short A distributed workflow-based architecture for content-based image retrieval
title_full A distributed workflow-based architecture for content-based image retrieval
title_fullStr A distributed workflow-based architecture for content-based image retrieval
title_full_unstemmed A distributed workflow-based architecture for content-based image retrieval
title_sort A distributed workflow-based architecture for content-based image retrieval
author Oliveira, Luis Fernando Milano
author_facet Oliveira, Luis Fernando Milano
author_role author
dc.contributor.none.fl_str_mv Kaster, Daniel dos Santos [Orientador]
Bugatti, Pedro Henrique
Barbon Junior, Sylvio
dc.contributor.author.fl_str_mv Oliveira, Luis Fernando Milano
dc.subject.por.fl_str_mv Fluxo de trabalho
Similaridade (Física)
Computação distribuída
Imagens
Workflow
Similarity (Physics)
Distributed computation
Images
topic Fluxo de trabalho
Similaridade (Física)
Computação distribuída
Imagens
Workflow
Similarity (Physics)
Distributed computation
Images
description Resumo: O aumento de conjunto de dados é um dos desafios que devem ser superados por sistemas de gerenciamento de dados, uma vez que usuários geram muita informação diariamente Contudo, apenas armazenar esses dados não é suficiente Também é necessário que sejam fornecidas maneiras de se recuperar informação relevante dentro desse oceano de dados Dados complexos – como imagens, vídeos, e dados espaciais – ainda adicionam outro desafio, na medida em que eles exigem técnicas de recuperação específicas, como buscas por simaridade Neste trabalho, nossa primeira preocupação é fornecer métodos que permitam a usuários incluir seu conhecimento de domínio para construir uma representação desses dados complexos que se assemelha à suas noções de similaridade, o que chamamos de espaços de similaridade Assim que um espaço de similaridade é definido, nós também fornecemos mecanismos para a realização eficiente de buscas de dados complexos Nossas contribuições são: uma arquitetura distribuída que permite a definição de espaços de similaridade através de workflows científicos; e (ii) uma abordagem de consulta a espaços de similaridade em ambientes distribuídos Essa segunda abordagem permite que virtualmente qualquer método de acesso métrico seja usado como um plugin para a arquitetura, delegando a eles a responsabilidade por tarefas de indexação, poda e processamento de consultas, o que permite que índices centralizados sejam executados em ambientes distribuídos As abordagens foram implementadas em um framework e através de uma avaliação foi possível alcançar um speedup linear em atividades de definição de espaços de similaridade, enquanto a performance em buscas por similaridade foi de até 24 vezes melhor quando comparada a um método sequencial
publishDate 2024
dc.date.none.fl_str_mv 2018.00
2024-05-01T12:13:34Z
2024-05-01T12:13:34Z
27.04.2018
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.uel.br/handle/123456789/10033
url https://repositorio.uel.br/handle/123456789/10033
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv Mestrado
Ciência da Computação
Centro de Ciências Exatas
Programa de Pós-Graduação em Ciência da Computação
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv Londrina
dc.source.none.fl_str_mv reponame:Repositório Institucional da UEL
instname:Universidade Estadual de Londrina (UEL)
instacron:UEL
instname_str Universidade Estadual de Londrina (UEL)
instacron_str UEL
institution UEL
reponame_str Repositório Institucional da UEL
collection Repositório Institucional da UEL
repository.name.fl_str_mv Repositório Institucional da UEL - Universidade Estadual de Londrina (UEL)
repository.mail.fl_str_mv bcuel@uel.br||
_version_ 1809823272909406208