A middleware for workload-aware manipulation of RDF data stored into NoSQL databases

Detalhes bibliográficos
Autor(a) principal: Santana, Luiz Henrique Zambom
Data de Publicação: 2019
Tipo de documento: Tese
Idioma: eng
Título da fonte: Repositório Institucional da UFSC
Texto Completo: https://repositorio.ufsc.br/handle/123456789/215025
Resumo: Tese (doutorado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2019.
id UFSC_07ad97e6a1be39cbdf576ca0b27e5e6a
oai_identifier_str oai:repositorio.ufsc.br:123456789/215025
network_acronym_str UFSC
network_name_str Repositório Institucional da UFSC
repository_id_str 2373
spelling A middleware for workload-aware manipulation of RDF data stored into NoSQL databasesComputaçãoMiddlewareWeb semânticaRDF (Resource Description Framework)Banco de dados não relacionaisTese (doutorado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2019.A Web Semântica tem quase 20 anos e muitos avanços foram propostos para atender a essa visão desde o artigo seminal de Berners-Lee et al., publicado em 2001. Entre esses avanços, os padrões propostos pelo W3C, como RDF e SPARQL, alcançaram uma versão madura e atualmente são empregados em muitos projetos acadêmicos e da indústria. Repositórios de grandes grafos RDF, chamados triplestores, são um tópico importante na área de gerenciamento de informações e conhecimento. Os triplestores evoluíram lado a lado com a pesquisa de banco de dados e, desde o advento dos bancos de dados NoSQL, vários triplestores incluem essa família de bancos de dados em suas arquiteturas. Esta tese apresenta um triplestore chamado WA-RDF, proposto como um middleware para manipular dados no formato RDF, mantidos em bancos de dados NoSQL, através de SPARQL. O WA-RDF propõe uma camada de armazenamento poliglota que fornece contribuições principalmente nas áreas de pesquisa de fragmentação de dados, particionamento de dados e mapeamento de RDF para múltiplos bancos de dados NoSQL. Um componente de monitoramento da carga de operações (WAc) é o pilar central do WA-RDF. Ele permite que, de acordo com o formato da consulta da carga de trabalho típica em um grafo RDF, o WA-RDF encontre a melhor estratégia de mapeamento para reduzir o tempo de resposta da consulta. Três rodadas diferentes de avaliações experimentais são descritas na tese. A primeira compara nossa proposta com um banco de dados multimodelo, demonstrando como uma solução de persistência poliglota baseada em um único modelo de acesso pode facilitar o desenvolvimento de aplicações. Em seguida, o middleware é comparado com trabalhos relacionados recentes usando o WatDiv, um benchmark RDF/SPARQL moderno e popular. Por fim, analisa-se a aplicação do WA-RDF no domínio de trajetórias semânticas de objetos em movimento.Abstract: The Semantic Web has almost 20 years and many advances were proposed in order to meet this vision since the seminal paper of Berners-Lee et al., published in 2001. Among these advances, the standards guided by W3C, like RDF and SPARQL, achieved a mature version and are currently employed in many academic and industry projects. Repositories of large RDF graphs, called triplestores, are an important topic on information and knowledge management area. The triplestores evolved hand-to-hand with the database research, and since the advent of the NoSQL database, several triplestores include this family of databases in their architectures. This thesis presents a triplestore called WA-RDF (Workload-aware RDF), which is proposed as a middleware to manipulate data maintained by NoSQL databases using RDF and SPARQL. WA-RDF proposes a polyglot NoSQL storage layer that provides contributions mainly on data fragmentation, data partitioning and RDF-to-NoSQL mapping research areas. A Workload Awareness component (WAc) is the central pillar of WA-RDF. It allows that, accordingly to the query shape of typical workload over a RDF graph, WA-RDF finds the better mapping strategy in order to reduce the query response time. Three different rounds of experimental evaluations are described in the thesis. The first one compares our proposal to a multimodel database, demonstrating how a polyglot persistence solution based on a single access model can facilitate the development of applications. Then, the middleware is compared to recent baselines by using WatDiv, a modern and popular RDF/SPARQL benchmark. Finally, it is analyzed the application of WA-RDF in the domain of semantic trajectories of moving objects.Mello, Ronaldo dos SantosUniversidade Federal de Santa CatarinaSantana, Luiz Henrique Zambom2020-10-21T21:12:23Z2020-10-21T21:12:23Z2019info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesis97 p.| il., gráfs.application/pdf369035https://repositorio.ufsc.br/handle/123456789/215025engreponame:Repositório Institucional da UFSCinstname:Universidade Federal de Santa Catarina (UFSC)instacron:UFSCinfo:eu-repo/semantics/openAccess2020-10-21T21:12:23Zoai:repositorio.ufsc.br:123456789/215025Repositório InstitucionalPUBhttp://150.162.242.35/oai/requestopendoar:23732020-10-21T21:12:23Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)false
dc.title.none.fl_str_mv A middleware for workload-aware manipulation of RDF data stored into NoSQL databases
title A middleware for workload-aware manipulation of RDF data stored into NoSQL databases
spellingShingle A middleware for workload-aware manipulation of RDF data stored into NoSQL databases
Santana, Luiz Henrique Zambom
Computação
Middleware
Web semântica
RDF (Resource Description Framework)
Banco de dados não relacionais
title_short A middleware for workload-aware manipulation of RDF data stored into NoSQL databases
title_full A middleware for workload-aware manipulation of RDF data stored into NoSQL databases
title_fullStr A middleware for workload-aware manipulation of RDF data stored into NoSQL databases
title_full_unstemmed A middleware for workload-aware manipulation of RDF data stored into NoSQL databases
title_sort A middleware for workload-aware manipulation of RDF data stored into NoSQL databases
author Santana, Luiz Henrique Zambom
author_facet Santana, Luiz Henrique Zambom
author_role author
dc.contributor.none.fl_str_mv Mello, Ronaldo dos Santos
Universidade Federal de Santa Catarina
dc.contributor.author.fl_str_mv Santana, Luiz Henrique Zambom
dc.subject.por.fl_str_mv Computação
Middleware
Web semântica
RDF (Resource Description Framework)
Banco de dados não relacionais
topic Computação
Middleware
Web semântica
RDF (Resource Description Framework)
Banco de dados não relacionais
description Tese (doutorado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2019.
publishDate 2019
dc.date.none.fl_str_mv 2019
2020-10-21T21:12:23Z
2020-10-21T21:12:23Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv 369035
https://repositorio.ufsc.br/handle/123456789/215025
identifier_str_mv 369035
url https://repositorio.ufsc.br/handle/123456789/215025
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 97 p.| il., gráfs.
application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSC
instname:Universidade Federal de Santa Catarina (UFSC)
instacron:UFSC
instname_str Universidade Federal de Santa Catarina (UFSC)
instacron_str UFSC
institution UFSC
reponame_str Repositório Institucional da UFSC
collection Repositório Institucional da UFSC
repository.name.fl_str_mv Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)
repository.mail.fl_str_mv
_version_ 1808651934790320128