A mechanism to evaluate context-free queries inspired in LR(1) parsers over graph databases

Detalhes bibliográficos
Autor(a) principal: Santos, Fred de Castro
Data de Publicação: 2018
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFRN
Texto Completo: https://repositorio.ufrn.br/jspui/handle/123456789/24970
Resumo: A World Wide Web é uma coleção de informações sempre crescente. Esta informação é distribuída entre documentos diferentes, disponibilizados através do HTTP. Mesmo que essa informação seja acessível aos usuários na forma de artigos de notícias, transmissões de áudio, imagens e vídeos, os agentes de software geralmente não podem classificá-la. A falta de informações semânticas sobre esses documentos em um formato legível por máquina geralmente faz com que a análise seja imprecisa. Um número significativo de entidades adotaram Linked Data como uma forma de adicionar informações semânticas aos seus dados, e não apenas publicá-lo na Web. O resultado é uma coleção global de dados, chamada Web of Data, que forma um grafo global, composto por declarações no formato RDF [22] de diversas fontes, cobrindo todos os tipos de tópicos. Para encontrar informações específicas nesses grafos, as consultas são realizadas começando em um sujeito e analisando seus predicados nas instruções RDF. Esses predicados são as conexões entre o sujeito e o objeto, e um conjunto de trilhas forma um caminho de informação. O uso de HTTP como mecanismo padrão de acesso a dados e RDF como modelo de dados padrão simplifica o acesso a dados, o que nos motiva a pesquisar alternativas na forma como esses dados são buscados. Uma vez que a maioria das linguagens de consulta de banco de dados de grafo estão na classe de Linguagens Regulares, nós propomos seguir um caminho diferente e tentar usar uma classe de gramática menos restritiva, chamada Gramática Livre de Contexto Determinística, para aumentar a expressividade das consultas no banco de dados em grafo. Mais especificamente, aplicando o método de análise LR(1) para encontrar caminhos em um banco de dados de grafo RDF. O principal objetivo deste trabalho é prover meios para se permitir a utilização de técnicas de reconhecimento de gramáticas livres de contexto LR(1) para fazer consultas por caminhos formados pelas etiquetas das arestas em um banco de dados RDF. Fornecendo, como um resultado, uma ferramenta que se permita atingir melhor expressividade, eficiência e escalabilidade nestas consultas do que o que existe atualmente. Para atingir este objetivo, nós implementamos um algoritmo baseado nas técnicas de reconhecimento LR(1), usando o GSS [30] ao invés de uma pilha, e permitimos ao usuário fazer consultas com uma gramática livre de contexto (LR1). Também analisamos a complexidade do nosso algoritmo e executamos alguns experimentos, comparando nossa solução com as outras propostas na literatura, mostrando que a nossa pode ter melhor desempenho em alguns cenários.
id UFRN_7d64b375769b65e469b314c0a61f9562
oai_identifier_str oai:https://repositorio.ufrn.br:123456789/24970
network_acronym_str UFRN
network_name_str Repositório Institucional da UFRN
repository_id_str
spelling Santos, Fred de CastroMusicante, Martin AlejandroOliveira, Marcel Vinicius MedeirosBigonha, Mariza Andrade da SilvaMedeiros, Sérgio Queiroz deCosta, Umberto Souza da2018-04-04T12:11:32Z2018-04-04T12:11:32Z2018-02-23SANTOS, Fred de Castro. A mechanism to evaluate context-free queries inspired in LR(1) parsers over graph databases. 2018. 85f. Dissertação (Mestrado em Sistemas e Computação) - Centro de Ciências Exatas e da Terra, Universidade Federal do Rio Grande do Norte, Natal, 2018.https://repositorio.ufrn.br/jspui/handle/123456789/24970A World Wide Web é uma coleção de informações sempre crescente. Esta informação é distribuída entre documentos diferentes, disponibilizados através do HTTP. Mesmo que essa informação seja acessível aos usuários na forma de artigos de notícias, transmissões de áudio, imagens e vídeos, os agentes de software geralmente não podem classificá-la. A falta de informações semânticas sobre esses documentos em um formato legível por máquina geralmente faz com que a análise seja imprecisa. Um número significativo de entidades adotaram Linked Data como uma forma de adicionar informações semânticas aos seus dados, e não apenas publicá-lo na Web. O resultado é uma coleção global de dados, chamada Web of Data, que forma um grafo global, composto por declarações no formato RDF [22] de diversas fontes, cobrindo todos os tipos de tópicos. Para encontrar informações específicas nesses grafos, as consultas são realizadas começando em um sujeito e analisando seus predicados nas instruções RDF. Esses predicados são as conexões entre o sujeito e o objeto, e um conjunto de trilhas forma um caminho de informação. O uso de HTTP como mecanismo padrão de acesso a dados e RDF como modelo de dados padrão simplifica o acesso a dados, o que nos motiva a pesquisar alternativas na forma como esses dados são buscados. Uma vez que a maioria das linguagens de consulta de banco de dados de grafo estão na classe de Linguagens Regulares, nós propomos seguir um caminho diferente e tentar usar uma classe de gramática menos restritiva, chamada Gramática Livre de Contexto Determinística, para aumentar a expressividade das consultas no banco de dados em grafo. Mais especificamente, aplicando o método de análise LR(1) para encontrar caminhos em um banco de dados de grafo RDF. O principal objetivo deste trabalho é prover meios para se permitir a utilização de técnicas de reconhecimento de gramáticas livres de contexto LR(1) para fazer consultas por caminhos formados pelas etiquetas das arestas em um banco de dados RDF. Fornecendo, como um resultado, uma ferramenta que se permita atingir melhor expressividade, eficiência e escalabilidade nestas consultas do que o que existe atualmente. Para atingir este objetivo, nós implementamos um algoritmo baseado nas técnicas de reconhecimento LR(1), usando o GSS [30] ao invés de uma pilha, e permitimos ao usuário fazer consultas com uma gramática livre de contexto (LR1). Também analisamos a complexidade do nosso algoritmo e executamos alguns experimentos, comparando nossa solução com as outras propostas na literatura, mostrando que a nossa pode ter melhor desempenho em alguns cenários.The World Wide Web is an always increasing collection of information. This information is spread among different documents, which are made available by using the HTTP. Even though this information is accessible to users in the form of news articles, audio broadcasts, images and videos, software agents often cannot classify it. The lack of semantic information about these documents in a machine-readable format usually makes the analysis inaccurate. A significant number of entities have adopted Linked Data as a way to add semantic information to their data, not just publishing it on the Web. The result is a global data collection, called the Web of Data, which forms a global graph, consisting of RDF [22] statements from numerous sources, covering all sorts of topics. To find specific information in this graph, queries are performed starting at a subject and analyzing their predicates in the RDF statements. These predicates are the connections between the subject and object, and a set of traces forms an information path. The use of HTTP as a standardized data access mechanism and RDF as a standard data model simplifies the data access, but accessing heterogeneous data on distinct locations may have an increased time complexity and current query languages have a reduced query expressiveness, which motivates us to research alternatives in how this data is queried. This reduced expressiveness happens because most query languages belong to the class of Regular Languages. The main goal of this work is to use LR(1) context-free grammar processing techniques to search for context-free paths over RDF graph databases, providing, as result, a tool which allows better expressiveness, efficiency and scalability in such queries than what is proposed today. To achieve that, we implemented an algorithm based on the LR(1) parsing technique that uses the GSS [30] structure instead of a stack, and give means for the user to input queries with an LR(1) context-free grammar. Also, we analyze our algorithm’s complexity and make some experiments, comparing our solution to other proposals present in the literature and show that ours can have better performance in given scenarios.porCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAOBancos de Dados em GrafoExpressividade de linguagens de consultaRDFLinguagens LR(1)A mechanism to evaluate context-free queries inspired in LR(1) parsers over graph databasesinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisPROGRAMA DE PÓS-GRADUAÇÃO EM SISTEMAS E COMPUTAÇÃOUFRNBrasilinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRNinstname:Universidade Federal do Rio Grande do Norte (UFRN)instacron:UFRNTEXTFredDeCastroSantos_DISSERT.pdf.txtFredDeCastroSantos_DISSERT.pdf.txtExtracted texttext/plain124580https://repositorio.ufrn.br/bitstream/123456789/24970/2/FredDeCastroSantos_DISSERT.pdf.txtac06e9a68284056f7b8ecd0a729ba76aMD52THUMBNAILFredDeCastroSantos_DISSERT.pdf.jpgFredDeCastroSantos_DISSERT.pdf.jpgIM Thumbnailimage/jpeg2974https://repositorio.ufrn.br/bitstream/123456789/24970/3/FredDeCastroSantos_DISSERT.pdf.jpge6e873db864f2bd484ef9449b978bb0fMD53ORIGINALFredDeCastroSantos_DISSERT.pdfFredDeCastroSantos_DISSERT.pdfapplication/pdf1940661https://repositorio.ufrn.br/bitstream/123456789/24970/1/FredDeCastroSantos_DISSERT.pdf7cd19a0adff2dc7261f668027656da45MD51123456789/249702019-01-30 17:38:36.484oai:https://repositorio.ufrn.br:123456789/24970Repositório de PublicaçõesPUBhttp://repositorio.ufrn.br/oai/opendoar:2019-01-30T20:38:36Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)false
dc.title.pt_BR.fl_str_mv A mechanism to evaluate context-free queries inspired in LR(1) parsers over graph databases
title A mechanism to evaluate context-free queries inspired in LR(1) parsers over graph databases
spellingShingle A mechanism to evaluate context-free queries inspired in LR(1) parsers over graph databases
Santos, Fred de Castro
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
Bancos de Dados em Grafo
Expressividade de linguagens de consulta
RDF
Linguagens LR(1)
title_short A mechanism to evaluate context-free queries inspired in LR(1) parsers over graph databases
title_full A mechanism to evaluate context-free queries inspired in LR(1) parsers over graph databases
title_fullStr A mechanism to evaluate context-free queries inspired in LR(1) parsers over graph databases
title_full_unstemmed A mechanism to evaluate context-free queries inspired in LR(1) parsers over graph databases
title_sort A mechanism to evaluate context-free queries inspired in LR(1) parsers over graph databases
author Santos, Fred de Castro
author_facet Santos, Fred de Castro
author_role author
dc.contributor.authorID.pt_BR.fl_str_mv
dc.contributor.advisorID.pt_BR.fl_str_mv
dc.contributor.advisor-co1ID.pt_BR.fl_str_mv
dc.contributor.referees1.none.fl_str_mv Oliveira, Marcel Vinicius Medeiros
dc.contributor.referees1ID.pt_BR.fl_str_mv
dc.contributor.referees2.none.fl_str_mv Bigonha, Mariza Andrade da Silva
dc.contributor.referees2ID.pt_BR.fl_str_mv
dc.contributor.referees3.none.fl_str_mv Medeiros, Sérgio Queiroz de
dc.contributor.referees3ID.pt_BR.fl_str_mv
dc.contributor.author.fl_str_mv Santos, Fred de Castro
dc.contributor.advisor-co1.fl_str_mv Musicante, Martin Alejandro
dc.contributor.advisor1.fl_str_mv Costa, Umberto Souza da
contributor_str_mv Musicante, Martin Alejandro
Costa, Umberto Souza da
dc.subject.cnpq.fl_str_mv CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
topic CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
Bancos de Dados em Grafo
Expressividade de linguagens de consulta
RDF
Linguagens LR(1)
dc.subject.por.fl_str_mv Bancos de Dados em Grafo
Expressividade de linguagens de consulta
RDF
Linguagens LR(1)
description A World Wide Web é uma coleção de informações sempre crescente. Esta informação é distribuída entre documentos diferentes, disponibilizados através do HTTP. Mesmo que essa informação seja acessível aos usuários na forma de artigos de notícias, transmissões de áudio, imagens e vídeos, os agentes de software geralmente não podem classificá-la. A falta de informações semânticas sobre esses documentos em um formato legível por máquina geralmente faz com que a análise seja imprecisa. Um número significativo de entidades adotaram Linked Data como uma forma de adicionar informações semânticas aos seus dados, e não apenas publicá-lo na Web. O resultado é uma coleção global de dados, chamada Web of Data, que forma um grafo global, composto por declarações no formato RDF [22] de diversas fontes, cobrindo todos os tipos de tópicos. Para encontrar informações específicas nesses grafos, as consultas são realizadas começando em um sujeito e analisando seus predicados nas instruções RDF. Esses predicados são as conexões entre o sujeito e o objeto, e um conjunto de trilhas forma um caminho de informação. O uso de HTTP como mecanismo padrão de acesso a dados e RDF como modelo de dados padrão simplifica o acesso a dados, o que nos motiva a pesquisar alternativas na forma como esses dados são buscados. Uma vez que a maioria das linguagens de consulta de banco de dados de grafo estão na classe de Linguagens Regulares, nós propomos seguir um caminho diferente e tentar usar uma classe de gramática menos restritiva, chamada Gramática Livre de Contexto Determinística, para aumentar a expressividade das consultas no banco de dados em grafo. Mais especificamente, aplicando o método de análise LR(1) para encontrar caminhos em um banco de dados de grafo RDF. O principal objetivo deste trabalho é prover meios para se permitir a utilização de técnicas de reconhecimento de gramáticas livres de contexto LR(1) para fazer consultas por caminhos formados pelas etiquetas das arestas em um banco de dados RDF. Fornecendo, como um resultado, uma ferramenta que se permita atingir melhor expressividade, eficiência e escalabilidade nestas consultas do que o que existe atualmente. Para atingir este objetivo, nós implementamos um algoritmo baseado nas técnicas de reconhecimento LR(1), usando o GSS [30] ao invés de uma pilha, e permitimos ao usuário fazer consultas com uma gramática livre de contexto (LR1). Também analisamos a complexidade do nosso algoritmo e executamos alguns experimentos, comparando nossa solução com as outras propostas na literatura, mostrando que a nossa pode ter melhor desempenho em alguns cenários.
publishDate 2018
dc.date.accessioned.fl_str_mv 2018-04-04T12:11:32Z
dc.date.available.fl_str_mv 2018-04-04T12:11:32Z
dc.date.issued.fl_str_mv 2018-02-23
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv SANTOS, Fred de Castro. A mechanism to evaluate context-free queries inspired in LR(1) parsers over graph databases. 2018. 85f. Dissertação (Mestrado em Sistemas e Computação) - Centro de Ciências Exatas e da Terra, Universidade Federal do Rio Grande do Norte, Natal, 2018.
dc.identifier.uri.fl_str_mv https://repositorio.ufrn.br/jspui/handle/123456789/24970
identifier_str_mv SANTOS, Fred de Castro. A mechanism to evaluate context-free queries inspired in LR(1) parsers over graph databases. 2018. 85f. Dissertação (Mestrado em Sistemas e Computação) - Centro de Ciências Exatas e da Terra, Universidade Federal do Rio Grande do Norte, Natal, 2018.
url https://repositorio.ufrn.br/jspui/handle/123456789/24970
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.program.fl_str_mv PROGRAMA DE PÓS-GRADUAÇÃO EM SISTEMAS E COMPUTAÇÃO
dc.publisher.initials.fl_str_mv UFRN
dc.publisher.country.fl_str_mv Brasil
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRN
instname:Universidade Federal do Rio Grande do Norte (UFRN)
instacron:UFRN
instname_str Universidade Federal do Rio Grande do Norte (UFRN)
instacron_str UFRN
institution UFRN
reponame_str Repositório Institucional da UFRN
collection Repositório Institucional da UFRN
bitstream.url.fl_str_mv https://repositorio.ufrn.br/bitstream/123456789/24970/2/FredDeCastroSantos_DISSERT.pdf.txt
https://repositorio.ufrn.br/bitstream/123456789/24970/3/FredDeCastroSantos_DISSERT.pdf.jpg
https://repositorio.ufrn.br/bitstream/123456789/24970/1/FredDeCastroSantos_DISSERT.pdf
bitstream.checksum.fl_str_mv ac06e9a68284056f7b8ecd0a729ba76a
e6e873db864f2bd484ef9449b978bb0f
7cd19a0adff2dc7261f668027656da45
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)
repository.mail.fl_str_mv
_version_ 1802117888697434112