A distributed workflow-based architecture for content-based image retrieval
Autor(a) principal: | |
---|---|
Data de Publicação: | 2024 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UEL |
Texto Completo: | https://repositorio.uel.br/handle/123456789/10033 |
Resumo: | Resumo: O aumento de conjunto de dados é um dos desafios que devem ser superados por sistemas de gerenciamento de dados, uma vez que usuários geram muita informação diariamente Contudo, apenas armazenar esses dados não é suficiente Também é necessário que sejam fornecidas maneiras de se recuperar informação relevante dentro desse oceano de dados Dados complexos – como imagens, vídeos, e dados espaciais – ainda adicionam outro desafio, na medida em que eles exigem técnicas de recuperação específicas, como buscas por simaridade Neste trabalho, nossa primeira preocupação é fornecer métodos que permitam a usuários incluir seu conhecimento de domínio para construir uma representação desses dados complexos que se assemelha à suas noções de similaridade, o que chamamos de espaços de similaridade Assim que um espaço de similaridade é definido, nós também fornecemos mecanismos para a realização eficiente de buscas de dados complexos Nossas contribuições são: uma arquitetura distribuída que permite a definição de espaços de similaridade através de workflows científicos; e (ii) uma abordagem de consulta a espaços de similaridade em ambientes distribuídos Essa segunda abordagem permite que virtualmente qualquer método de acesso métrico seja usado como um plugin para a arquitetura, delegando a eles a responsabilidade por tarefas de indexação, poda e processamento de consultas, o que permite que índices centralizados sejam executados em ambientes distribuídos As abordagens foram implementadas em um framework e através de uma avaliação foi possível alcançar um speedup linear em atividades de definição de espaços de similaridade, enquanto a performance em buscas por similaridade foi de até 24 vezes melhor quando comparada a um método sequencial |
id |
UEL_8635bb05a791300711a74c45a80b6af5 |
---|---|
oai_identifier_str |
oai:repositorio.uel.br:123456789/10033 |
network_acronym_str |
UEL |
network_name_str |
Repositório Institucional da UEL |
repository_id_str |
|
spelling |
A distributed workflow-based architecture for content-based image retrievalFluxo de trabalhoSimilaridade (Física)Computação distribuídaImagensWorkflowSimilarity (Physics)Distributed computationImagesResumo: O aumento de conjunto de dados é um dos desafios que devem ser superados por sistemas de gerenciamento de dados, uma vez que usuários geram muita informação diariamente Contudo, apenas armazenar esses dados não é suficiente Também é necessário que sejam fornecidas maneiras de se recuperar informação relevante dentro desse oceano de dados Dados complexos – como imagens, vídeos, e dados espaciais – ainda adicionam outro desafio, na medida em que eles exigem técnicas de recuperação específicas, como buscas por simaridade Neste trabalho, nossa primeira preocupação é fornecer métodos que permitam a usuários incluir seu conhecimento de domínio para construir uma representação desses dados complexos que se assemelha à suas noções de similaridade, o que chamamos de espaços de similaridade Assim que um espaço de similaridade é definido, nós também fornecemos mecanismos para a realização eficiente de buscas de dados complexos Nossas contribuições são: uma arquitetura distribuída que permite a definição de espaços de similaridade através de workflows científicos; e (ii) uma abordagem de consulta a espaços de similaridade em ambientes distribuídos Essa segunda abordagem permite que virtualmente qualquer método de acesso métrico seja usado como um plugin para a arquitetura, delegando a eles a responsabilidade por tarefas de indexação, poda e processamento de consultas, o que permite que índices centralizados sejam executados em ambientes distribuídos As abordagens foram implementadas em um framework e através de uma avaliação foi possível alcançar um speedup linear em atividades de definição de espaços de similaridade, enquanto a performance em buscas por similaridade foi de até 24 vezes melhor quando comparada a um método sequencialDissertação (Mestrado em Ciência da Computação) - Universidade Estadual de Londrina, Centro de Ciências Exatas, Programa de Pós-Graduação em Ciência da ComputaçãoAbstract: The increasing size of datasets imposes a challenge for data management systems, as people produce tons of information everyday Not only data should be stored, but ways of fetching relevant information among in this flood of data are also in demand Complex data, such as images, videos, and spatial data, bring an even harder challenge since they require specific retrieval techniques, such as similarity search In this work, our first concern is to provide methods that allow users to embed their domain knowledge to build a representation of complex data that resembles their notion of similarity, which we call similarity space Once a similarity space is defined, we also aim at providing ways for efficient distributed similarity search in datasets that are too big for being processed by centralized approaches Our contributions are: (i) a distributed architecture that allows the definition of similarity spaces through scientific workflows; and (ii) an approach for querying similarity spaces in distributed environments This search mechanism allows virtually any metric access method to be used as a plugin to the architecture, delegating to them the responsibility of indexing, pruning, and query processing tasks, which enables centralized indexes to be run in distributed environments We evaluated our approaches implemented in a framework and were able to achieve linear speedup in similarity space definition activities while up to 24 times faster similarity searches when compared to a baseline sequential methodKaster, Daniel dos Santos [Orientador]Bugatti, Pedro HenriqueBarbon Junior, SylvioOliveira, Luis Fernando Milano2024-05-01T12:13:34Z2024-05-01T12:13:34Z2018.0027.04.2018info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://repositorio.uel.br/handle/123456789/10033porMestradoCiência da ComputaçãoCentro de Ciências ExatasPrograma de Pós-Graduação em Ciência da ComputaçãoLondrinareponame:Repositório Institucional da UELinstname:Universidade Estadual de Londrina (UEL)instacron:UELinfo:eu-repo/semantics/openAccess2024-07-12T04:19:59Zoai:repositorio.uel.br:123456789/10033Biblioteca Digital de Teses e Dissertaçõeshttp://www.bibliotecadigital.uel.br/PUBhttp://www.bibliotecadigital.uel.br/OAI/oai2.phpbcuel@uel.br||opendoar:2024-07-12T04:19:59Repositório Institucional da UEL - Universidade Estadual de Londrina (UEL)false |
dc.title.none.fl_str_mv |
A distributed workflow-based architecture for content-based image retrieval |
title |
A distributed workflow-based architecture for content-based image retrieval |
spellingShingle |
A distributed workflow-based architecture for content-based image retrieval Oliveira, Luis Fernando Milano Fluxo de trabalho Similaridade (Física) Computação distribuída Imagens Workflow Similarity (Physics) Distributed computation Images |
title_short |
A distributed workflow-based architecture for content-based image retrieval |
title_full |
A distributed workflow-based architecture for content-based image retrieval |
title_fullStr |
A distributed workflow-based architecture for content-based image retrieval |
title_full_unstemmed |
A distributed workflow-based architecture for content-based image retrieval |
title_sort |
A distributed workflow-based architecture for content-based image retrieval |
author |
Oliveira, Luis Fernando Milano |
author_facet |
Oliveira, Luis Fernando Milano |
author_role |
author |
dc.contributor.none.fl_str_mv |
Kaster, Daniel dos Santos [Orientador] Bugatti, Pedro Henrique Barbon Junior, Sylvio |
dc.contributor.author.fl_str_mv |
Oliveira, Luis Fernando Milano |
dc.subject.por.fl_str_mv |
Fluxo de trabalho Similaridade (Física) Computação distribuída Imagens Workflow Similarity (Physics) Distributed computation Images |
topic |
Fluxo de trabalho Similaridade (Física) Computação distribuída Imagens Workflow Similarity (Physics) Distributed computation Images |
description |
Resumo: O aumento de conjunto de dados é um dos desafios que devem ser superados por sistemas de gerenciamento de dados, uma vez que usuários geram muita informação diariamente Contudo, apenas armazenar esses dados não é suficiente Também é necessário que sejam fornecidas maneiras de se recuperar informação relevante dentro desse oceano de dados Dados complexos – como imagens, vídeos, e dados espaciais – ainda adicionam outro desafio, na medida em que eles exigem técnicas de recuperação específicas, como buscas por simaridade Neste trabalho, nossa primeira preocupação é fornecer métodos que permitam a usuários incluir seu conhecimento de domínio para construir uma representação desses dados complexos que se assemelha à suas noções de similaridade, o que chamamos de espaços de similaridade Assim que um espaço de similaridade é definido, nós também fornecemos mecanismos para a realização eficiente de buscas de dados complexos Nossas contribuições são: uma arquitetura distribuída que permite a definição de espaços de similaridade através de workflows científicos; e (ii) uma abordagem de consulta a espaços de similaridade em ambientes distribuídos Essa segunda abordagem permite que virtualmente qualquer método de acesso métrico seja usado como um plugin para a arquitetura, delegando a eles a responsabilidade por tarefas de indexação, poda e processamento de consultas, o que permite que índices centralizados sejam executados em ambientes distribuídos As abordagens foram implementadas em um framework e através de uma avaliação foi possível alcançar um speedup linear em atividades de definição de espaços de similaridade, enquanto a performance em buscas por similaridade foi de até 24 vezes melhor quando comparada a um método sequencial |
publishDate |
2024 |
dc.date.none.fl_str_mv |
2018.00 2024-05-01T12:13:34Z 2024-05-01T12:13:34Z 27.04.2018 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://repositorio.uel.br/handle/123456789/10033 |
url |
https://repositorio.uel.br/handle/123456789/10033 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
Mestrado Ciência da Computação Centro de Ciências Exatas Programa de Pós-Graduação em Ciência da Computação |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.coverage.none.fl_str_mv |
Londrina |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UEL instname:Universidade Estadual de Londrina (UEL) instacron:UEL |
instname_str |
Universidade Estadual de Londrina (UEL) |
instacron_str |
UEL |
institution |
UEL |
reponame_str |
Repositório Institucional da UEL |
collection |
Repositório Institucional da UEL |
repository.name.fl_str_mv |
Repositório Institucional da UEL - Universidade Estadual de Londrina (UEL) |
repository.mail.fl_str_mv |
bcuel@uel.br|| |
_version_ |
1809823272909406208 |