FESHYD : busca federada sobre bases de dados RDF híbridas

Detalhes bibliográficos
Autor(a) principal: Takiuchi, Hugo Paulino Bonfim, 1992-
Data de Publicação: 2020
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFPR
Texto Completo: https://hdl.handle.net/1884/69244
Resumo: Orientadora: Carmem Satie Hara
id UFPR_ffddcaed5b4ab0feecea0238bc2d733a
oai_identifier_str oai:acervodigital.ufpr.br:1884/69244
network_acronym_str UFPR
network_name_str Repositório Institucional da UFPR
repository_id_str 308
spelling Takiuchi, Hugo Paulino Bonfim, 1992-Hara, Carmem Satie, 1964-Penteado, Raqueline Ritter de MouraUniversidade Federal do Paraná. Setor de Ciências Exatas. Programa de Pós-Graduação em Informática2021-06-21T20:37:49Z2021-06-21T20:37:49Z2020https://hdl.handle.net/1884/69244Orientadora: Carmem Satie HaraCoorientadora: Raqueline Ritter de Moura PenteadoDissertação (mestrado) - Universidade Federal do Paraná, Setor de Ciências Exatas, Programa de Pós-Graduação em Informática. Defesa : Curitiba, 04/09/2020Inclui referências: p.66-67Área de concentração: Ciência da ComputaçãoResumo Na Web Semantica, os dados sao disponibilizados no formato RDF e consultados por meio da linguagem SPARQL. A maioria dos processadores de consultas consideram apenas bases RDF federadas ou apenas bases proprietarias. Bases federadas consistem de um conjunto de repositorios autonomos, enquanto bases proprietarias permitem acesso irrestrito, tanto aos dados quanto ao processamento interno da consulta. Caso uma consulta envolva tanto dados de bases de terceiros autonomas bem como dados da base proprietaria, existem duas alternativas para o seu processamento: (i) tratar a base proprietaria como um componente da base federada; (ii) intervencao do usuario para integrar os dados de base proprietaria e federada. Embora ambas permitam integracao de dados da base, elas nao exploram otimizacoes que sao possiveis pelo fato de haver acesso irrestrito a base proprietaria. Esta questao e tratada nesta dissertacao, com a proposta de uma terceira alternativa, denominada de FeSHyD, que processa consultas SPARQL tanto sobre bases federadas quanto proprietarias distribuidas. O FeSHyD gera um plano de consultas otimizado, que e executado em paralelo por todos os servidores que compoem a base proprietaria. Durante a geracao do plano, a otimizacao envolve metodos para a selecao das fontes e para a ordenacao dos blocos que compoem o plano de consulta, de forma que a base proprietaria seja explorada antes de submeter subconsultas as bases de terceiros. Durante o processamento da consulta, os servidores da base proprietaria submetem estas subconsultas a base federada diretamente, sem a existencia de um ponto central de controle. O sistema foi implementado e os resultados experimentais mostram que ele reduz o tempo de processamento de consultas em ate 45% comparado a alternativa de tratar a base proprietaria como um componente de uma base federada. Palavras-chave: busca federada, consulta SPARQL, bases de dados hibridas distribuidas, integracao de sistemas distribuidos, selecao de fontes, ordenacao das subconsultas.Abstract In the Semantic Web, data is made available in RDF format and queried using the SPARQL language. Most query processors consider only federated RDF bases or only proprietary bases. Federated databases consist of a set of autonomous repositories, while proprietary databases allow unrestricted access, both to data and to query processing execution alternatives. If a query involves both data from autonomous third party databases as well as data from the proprietary database, there are two alternatives for processing it: (i) consider the proprietary base as a component of the federated database; (ii) rely on user intervention to integrate the proprietary and federated databases. Although both alternatives promote data integration, they do not explore optimizations that are possible by the fact that there is unrestricted access to the proprietary base. This issue is addressed in this dissertation, with the proposal of a third alternative, called FeSHyD, which processes SPARQL queries on both federated and distributed proprietary bases. FeSHyD generates an optimized query plan that is executed in parallel by all servers that compose the proprietary database. During the generation of the plan, the optimization involves methods for selecting external data sources, and for ordering the blocks that compose the query plan such that the proprietary base is explored before subqueries are submitted to external sources. During query processing, these subqueries are sent to third party databases directly by the servers, without relying on a central control point. The system was implemented and the experimental results show that it reduces query processing time by up to 45% compared to the alternative of considering the proprietary base as a component of a federated database. Keywords: federated search, SPARQL query, distributed hybrid databases, distributed system integration, source selection, subquery ordering70 p. : il.application/pdfBanco de dados distribuídoWeb semânticaCiência da ComputaçãoFESHYD : busca federada sobre bases de dados RDF híbridasinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisporreponame:Repositório Institucional da UFPRinstname:Universidade Federal do Paraná (UFPR)instacron:UFPRinfo:eu-repo/semantics/openAccessORIGINALR - D - HUGO PAULINO BONFIM TAKIUCHI.pdfapplication/pdf1931826https://acervodigital.ufpr.br/bitstream/1884/69244/1/R%20-%20D%20-%20HUGO%20PAULINO%20BONFIM%20TAKIUCHI.pdfe6cc640f2e76a689d1dfa5ee69d34daeMD51open access1884/692442021-06-21 17:37:49.832open accessoai:acervodigital.ufpr.br:1884/69244Repositório de PublicaçõesPUBhttp://acervodigital.ufpr.br/oai/requestopendoar:3082021-06-21T20:37:49Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR)false
dc.title.pt_BR.fl_str_mv FESHYD : busca federada sobre bases de dados RDF híbridas
title FESHYD : busca federada sobre bases de dados RDF híbridas
spellingShingle FESHYD : busca federada sobre bases de dados RDF híbridas
Takiuchi, Hugo Paulino Bonfim, 1992-
Banco de dados distribuído
Web semântica
Ciência da Computação
title_short FESHYD : busca federada sobre bases de dados RDF híbridas
title_full FESHYD : busca federada sobre bases de dados RDF híbridas
title_fullStr FESHYD : busca federada sobre bases de dados RDF híbridas
title_full_unstemmed FESHYD : busca federada sobre bases de dados RDF híbridas
title_sort FESHYD : busca federada sobre bases de dados RDF híbridas
author Takiuchi, Hugo Paulino Bonfim, 1992-
author_facet Takiuchi, Hugo Paulino Bonfim, 1992-
author_role author
dc.contributor.other.pt_BR.fl_str_mv Hara, Carmem Satie, 1964-
Penteado, Raqueline Ritter de Moura
Universidade Federal do Paraná. Setor de Ciências Exatas. Programa de Pós-Graduação em Informática
dc.contributor.author.fl_str_mv Takiuchi, Hugo Paulino Bonfim, 1992-
dc.subject.por.fl_str_mv Banco de dados distribuído
Web semântica
Ciência da Computação
topic Banco de dados distribuído
Web semântica
Ciência da Computação
description Orientadora: Carmem Satie Hara
publishDate 2020
dc.date.issued.fl_str_mv 2020
dc.date.accessioned.fl_str_mv 2021-06-21T20:37:49Z
dc.date.available.fl_str_mv 2021-06-21T20:37:49Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://hdl.handle.net/1884/69244
url https://hdl.handle.net/1884/69244
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 70 p. : il.
application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPR
instname:Universidade Federal do Paraná (UFPR)
instacron:UFPR
instname_str Universidade Federal do Paraná (UFPR)
instacron_str UFPR
institution UFPR
reponame_str Repositório Institucional da UFPR
collection Repositório Institucional da UFPR
bitstream.url.fl_str_mv https://acervodigital.ufpr.br/bitstream/1884/69244/1/R%20-%20D%20-%20HUGO%20PAULINO%20BONFIM%20TAKIUCHI.pdf
bitstream.checksum.fl_str_mv e6cc640f2e76a689d1dfa5ee69d34dae
bitstream.checksumAlgorithm.fl_str_mv MD5
repository.name.fl_str_mv Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR)
repository.mail.fl_str_mv
_version_ 1793437762170388480