Armazenamento otimizado de dados RDF em um SGBD relacional

Detalhes bibliográficos
Autor(a) principal: Prado, Rafael de Lima, 1990-
Data de Publicação: 2017
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFPR
Texto Completo: https://hdl.handle.net/1884/59443
Resumo: Orientadora: Prof.a Dr.a Carmem Satie Hara
id UFPR_950bc3e49962f36c54fe7b39785d5f5c
oai_identifier_str oai:acervodigital.ufpr.br:1884/59443
network_acronym_str UFPR
network_name_str Repositório Institucional da UFPR
repository_id_str 308
spelling Prado, Rafael de Lima, 1990-Universidade Federal do Paraná. Setor de Ciências Exatas. Programa de Pós-Graduação em InformáticaHara, Carmem Satie, 1964-2019-04-08T16:29:06Z2019-04-08T16:29:06Z2017https://hdl.handle.net/1884/59443Orientadora: Prof.a Dr.a Carmem Satie HaraDissertação (mestrado) - Universidade Federal do Paraná, Setor de Ciências Exatas, Programa de Pós-Graduação em Informática. Defesa : Curitiba, 29/01/2018Inclui referências: p. 57-58Resumo: A Web Semântica tem por objetivo tornar compreensíveis as informações disponíveis na Internet para as máquinas. O RDF é o modelo de dados padrão para a Web Semântica. Bases RDF são compostas por triplas (sujeito, predicado, objeto) e o SPARQL é a linguagem de consultas para RDF recomendado pelo W3C. Uma consulta define um padrão de triplas a ser encontrado na base de dados. Como o objeto de uma tripla pode ser o sujeito de outra, uma consulta SPARQL pode ser vista como a busca de um subgrafo no grafo que representa a base RDF. Dada a complexidade deste problema, a otimização do acesso às bases RDF é um desafio a ser enfrentado. Algumas abordagens têm surgido nesse contexto, representando os dados RDF em outros formatos, como, por exemplo, no modelo relacional. Nesse tipo de abordagem, os dados RDF são armazenados em um Sistema Gerenciador de Banco de Dados Relacional(SBGDR). A forma direta de mapeamento de dados RDF para uma base relacional se dá por meio de uma tabela SPO, ou seja, com três atributos - sujeito, predicado e objeto. Porém, esse método em geral não possui bom desempenho, uma vez que toda a base é armazenada em uma única tabela e consultas nessa tabela que envolvem mais de um padrão de triplas implicam na execução de auto-junções. O Armazenamento Otimizado de Dados RDF em um SGBD Relacional - AORR, proposto nesta dissertação, surge como uma forma alternativa de armazenamento de dados RDF em um SGBDR. O intuito é que consultas sobre o AORR possuam desempenho superior às realizadas sobre as tabelas SPO oriundas da abordagem direta. Tal ganho do AORR deve-se, principalmente, à identificação de entidades com estruturas similares na base RDF e a geração de uma tabela para cada entidade no esquema relacional. Dessa forma é minimizado a quantidade de junções a serem executadas para o processamento de consultas. Consultas SPARQL podem ser realizadas sobre a base relacional gerada devido às tabelas de metadados que o AORR cria no processo de extração de esquema. As informações de mapeamento armazenada nas tabelas de metadado possibilitam a tradução de consultas SPARQL para SQL. Elas também permitem que o AORR dê suporte a atualizações incrementais da base. Os resultados dos experimentos mostram que as consultas realizadas sobre a base gerada pelo AORR apresentam melhor desempenho que uma abordagem alternativa baseada em tabelas de entidade para o armazenamento de dados RDF. Palavras-chave: RDF. SPARQL. Metadado. SGBDR.Abstract: The main goal of the Semantic Web is to make machines understand the information available on the Internet. RDF is the Semantic Web standard data model. RDF databases consist of triples (subject, predicate, object). The W3C (World Wide Web Consortium) recommends SPARQL as the query language for RDF. A query in RDF involves searching for triple patterns in a database. Since the object of a triple can be the subject of another, SPARQL queries can interpreted as a problem of subgraph match on the graph representing an RDF database. Given the complexity of the problem, optimizing the access to RDF databases is a hard problem. One of the possible approaches to tackle this problem is to store RDF data in a different format, for example, the relational model. A direct mapping from RDF to the relational model stores the entire database in an SPO table (subject, predicate, object). However this mapping does not present a good performance because queries involving more than one triple pattern require auto-joins on this table. This dissertation proposes AORR (Armazenamento Otimizado de Dados RDF em um SGBD Relational) as an alternative approach to store RDF data in a Relational Database Management System (RDBMS). AORR identifies entities with similar structure in the RDF database and creates a table in the relational database for each entity. This table stores several predicates associated with the same subject and thus the amount of auto-joins to process queries is minimized. SPARQL queries can be translated to SQL on the resulting relacional database due metadata tables that AORR generates during the schema extraction process. These metadata tables also enables incremental updates of the database. The experimental results show that queries executed on AORR have better performance than an alternative approach based on entity tables for storing RDF data. Keywords: RDF. SPARQL. Metadata. RDBMS.82 p. : il. (algumas color.).application/pdfArmazenamento de dadosCiência da ComputaçãoBanco de dados relacionaisBanco de dados - GerenciaMetadadosArmazenamento otimizado de dados RDF em um SGBD relacionalinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisporreponame:Repositório Institucional da UFPRinstname:Universidade Federal do Paraná (UFPR)instacron:UFPRinfo:eu-repo/semantics/openAccessORIGINALR - D - RAFAEL DE LIMA PRADO.pdfapplication/pdf2494910https://acervodigital.ufpr.br/bitstream/1884/59443/1/R%20-%20D%20-%20RAFAEL%20DE%20LIMA%20PRADO.pdfbcd8976453b425d1cd2dd9f6f49b2490MD51open access1884/594432019-04-08 13:29:06.846open accessoai:acervodigital.ufpr.br:1884/59443Repositório de PublicaçõesPUBhttp://acervodigital.ufpr.br/oai/requestopendoar:3082019-04-08T16:29:06Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR)false
dc.title.pt_BR.fl_str_mv Armazenamento otimizado de dados RDF em um SGBD relacional
title Armazenamento otimizado de dados RDF em um SGBD relacional
spellingShingle Armazenamento otimizado de dados RDF em um SGBD relacional
Prado, Rafael de Lima, 1990-
Armazenamento de dados
Ciência da Computação
Banco de dados relacionais
Banco de dados - Gerencia
Metadados
title_short Armazenamento otimizado de dados RDF em um SGBD relacional
title_full Armazenamento otimizado de dados RDF em um SGBD relacional
title_fullStr Armazenamento otimizado de dados RDF em um SGBD relacional
title_full_unstemmed Armazenamento otimizado de dados RDF em um SGBD relacional
title_sort Armazenamento otimizado de dados RDF em um SGBD relacional
author Prado, Rafael de Lima, 1990-
author_facet Prado, Rafael de Lima, 1990-
author_role author
dc.contributor.other.pt_BR.fl_str_mv Universidade Federal do Paraná. Setor de Ciências Exatas. Programa de Pós-Graduação em Informática
dc.contributor.author.fl_str_mv Prado, Rafael de Lima, 1990-
dc.contributor.advisor1.fl_str_mv Hara, Carmem Satie, 1964-
contributor_str_mv Hara, Carmem Satie, 1964-
dc.subject.por.fl_str_mv Armazenamento de dados
Ciência da Computação
Banco de dados relacionais
Banco de dados - Gerencia
Metadados
topic Armazenamento de dados
Ciência da Computação
Banco de dados relacionais
Banco de dados - Gerencia
Metadados
description Orientadora: Prof.a Dr.a Carmem Satie Hara
publishDate 2017
dc.date.issued.fl_str_mv 2017
dc.date.accessioned.fl_str_mv 2019-04-08T16:29:06Z
dc.date.available.fl_str_mv 2019-04-08T16:29:06Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://hdl.handle.net/1884/59443
url https://hdl.handle.net/1884/59443
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 82 p. : il. (algumas color.).
application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPR
instname:Universidade Federal do Paraná (UFPR)
instacron:UFPR
instname_str Universidade Federal do Paraná (UFPR)
instacron_str UFPR
institution UFPR
reponame_str Repositório Institucional da UFPR
collection Repositório Institucional da UFPR
bitstream.url.fl_str_mv https://acervodigital.ufpr.br/bitstream/1884/59443/1/R%20-%20D%20-%20RAFAEL%20DE%20LIMA%20PRADO.pdf
bitstream.checksum.fl_str_mv bcd8976453b425d1cd2dd9f6f49b2490
bitstream.checksumAlgorithm.fl_str_mv MD5
repository.name.fl_str_mv Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR)
repository.mail.fl_str_mv
_version_ 1797699130390216704