A mechanism to evaluate context-free queries inspired in LR(1) parsers over graph databases
Autor(a) principal: | |
---|---|
Data de Publicação: | 2018 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFRN |
Texto Completo: | https://repositorio.ufrn.br/jspui/handle/123456789/24970 |
Resumo: | A World Wide Web é uma coleção de informações sempre crescente. Esta informação é distribuída entre documentos diferentes, disponibilizados através do HTTP. Mesmo que essa informação seja acessível aos usuários na forma de artigos de notícias, transmissões de áudio, imagens e vídeos, os agentes de software geralmente não podem classificá-la. A falta de informações semânticas sobre esses documentos em um formato legível por máquina geralmente faz com que a análise seja imprecisa. Um número significativo de entidades adotaram Linked Data como uma forma de adicionar informações semânticas aos seus dados, e não apenas publicá-lo na Web. O resultado é uma coleção global de dados, chamada Web of Data, que forma um grafo global, composto por declarações no formato RDF [22] de diversas fontes, cobrindo todos os tipos de tópicos. Para encontrar informações específicas nesses grafos, as consultas são realizadas começando em um sujeito e analisando seus predicados nas instruções RDF. Esses predicados são as conexões entre o sujeito e o objeto, e um conjunto de trilhas forma um caminho de informação. O uso de HTTP como mecanismo padrão de acesso a dados e RDF como modelo de dados padrão simplifica o acesso a dados, o que nos motiva a pesquisar alternativas na forma como esses dados são buscados. Uma vez que a maioria das linguagens de consulta de banco de dados de grafo estão na classe de Linguagens Regulares, nós propomos seguir um caminho diferente e tentar usar uma classe de gramática menos restritiva, chamada Gramática Livre de Contexto Determinística, para aumentar a expressividade das consultas no banco de dados em grafo. Mais especificamente, aplicando o método de análise LR(1) para encontrar caminhos em um banco de dados de grafo RDF. O principal objetivo deste trabalho é prover meios para se permitir a utilização de técnicas de reconhecimento de gramáticas livres de contexto LR(1) para fazer consultas por caminhos formados pelas etiquetas das arestas em um banco de dados RDF. Fornecendo, como um resultado, uma ferramenta que se permita atingir melhor expressividade, eficiência e escalabilidade nestas consultas do que o que existe atualmente. Para atingir este objetivo, nós implementamos um algoritmo baseado nas técnicas de reconhecimento LR(1), usando o GSS [30] ao invés de uma pilha, e permitimos ao usuário fazer consultas com uma gramática livre de contexto (LR1). Também analisamos a complexidade do nosso algoritmo e executamos alguns experimentos, comparando nossa solução com as outras propostas na literatura, mostrando que a nossa pode ter melhor desempenho em alguns cenários. |
id |
UFRN_7d64b375769b65e469b314c0a61f9562 |
---|---|
oai_identifier_str |
oai:https://repositorio.ufrn.br:123456789/24970 |
network_acronym_str |
UFRN |
network_name_str |
Repositório Institucional da UFRN |
repository_id_str |
|
spelling |
Santos, Fred de CastroMusicante, Martin AlejandroOliveira, Marcel Vinicius MedeirosBigonha, Mariza Andrade da SilvaMedeiros, Sérgio Queiroz deCosta, Umberto Souza da2018-04-04T12:11:32Z2018-04-04T12:11:32Z2018-02-23SANTOS, Fred de Castro. A mechanism to evaluate context-free queries inspired in LR(1) parsers over graph databases. 2018. 85f. Dissertação (Mestrado em Sistemas e Computação) - Centro de Ciências Exatas e da Terra, Universidade Federal do Rio Grande do Norte, Natal, 2018.https://repositorio.ufrn.br/jspui/handle/123456789/24970A World Wide Web é uma coleção de informações sempre crescente. Esta informação é distribuída entre documentos diferentes, disponibilizados através do HTTP. Mesmo que essa informação seja acessível aos usuários na forma de artigos de notícias, transmissões de áudio, imagens e vídeos, os agentes de software geralmente não podem classificá-la. A falta de informações semânticas sobre esses documentos em um formato legível por máquina geralmente faz com que a análise seja imprecisa. Um número significativo de entidades adotaram Linked Data como uma forma de adicionar informações semânticas aos seus dados, e não apenas publicá-lo na Web. O resultado é uma coleção global de dados, chamada Web of Data, que forma um grafo global, composto por declarações no formato RDF [22] de diversas fontes, cobrindo todos os tipos de tópicos. Para encontrar informações específicas nesses grafos, as consultas são realizadas começando em um sujeito e analisando seus predicados nas instruções RDF. Esses predicados são as conexões entre o sujeito e o objeto, e um conjunto de trilhas forma um caminho de informação. O uso de HTTP como mecanismo padrão de acesso a dados e RDF como modelo de dados padrão simplifica o acesso a dados, o que nos motiva a pesquisar alternativas na forma como esses dados são buscados. Uma vez que a maioria das linguagens de consulta de banco de dados de grafo estão na classe de Linguagens Regulares, nós propomos seguir um caminho diferente e tentar usar uma classe de gramática menos restritiva, chamada Gramática Livre de Contexto Determinística, para aumentar a expressividade das consultas no banco de dados em grafo. Mais especificamente, aplicando o método de análise LR(1) para encontrar caminhos em um banco de dados de grafo RDF. O principal objetivo deste trabalho é prover meios para se permitir a utilização de técnicas de reconhecimento de gramáticas livres de contexto LR(1) para fazer consultas por caminhos formados pelas etiquetas das arestas em um banco de dados RDF. Fornecendo, como um resultado, uma ferramenta que se permita atingir melhor expressividade, eficiência e escalabilidade nestas consultas do que o que existe atualmente. Para atingir este objetivo, nós implementamos um algoritmo baseado nas técnicas de reconhecimento LR(1), usando o GSS [30] ao invés de uma pilha, e permitimos ao usuário fazer consultas com uma gramática livre de contexto (LR1). Também analisamos a complexidade do nosso algoritmo e executamos alguns experimentos, comparando nossa solução com as outras propostas na literatura, mostrando que a nossa pode ter melhor desempenho em alguns cenários.The World Wide Web is an always increasing collection of information. This information is spread among different documents, which are made available by using the HTTP. Even though this information is accessible to users in the form of news articles, audio broadcasts, images and videos, software agents often cannot classify it. The lack of semantic information about these documents in a machine-readable format usually makes the analysis inaccurate. A significant number of entities have adopted Linked Data as a way to add semantic information to their data, not just publishing it on the Web. The result is a global data collection, called the Web of Data, which forms a global graph, consisting of RDF [22] statements from numerous sources, covering all sorts of topics. To find specific information in this graph, queries are performed starting at a subject and analyzing their predicates in the RDF statements. These predicates are the connections between the subject and object, and a set of traces forms an information path. The use of HTTP as a standardized data access mechanism and RDF as a standard data model simplifies the data access, but accessing heterogeneous data on distinct locations may have an increased time complexity and current query languages have a reduced query expressiveness, which motivates us to research alternatives in how this data is queried. This reduced expressiveness happens because most query languages belong to the class of Regular Languages. The main goal of this work is to use LR(1) context-free grammar processing techniques to search for context-free paths over RDF graph databases, providing, as result, a tool which allows better expressiveness, efficiency and scalability in such queries than what is proposed today. To achieve that, we implemented an algorithm based on the LR(1) parsing technique that uses the GSS [30] structure instead of a stack, and give means for the user to input queries with an LR(1) context-free grammar. Also, we analyze our algorithm’s complexity and make some experiments, comparing our solution to other proposals present in the literature and show that ours can have better performance in given scenarios.porCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAOBancos de Dados em GrafoExpressividade de linguagens de consultaRDFLinguagens LR(1)A mechanism to evaluate context-free queries inspired in LR(1) parsers over graph databasesinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisPROGRAMA DE PÓS-GRADUAÇÃO EM SISTEMAS E COMPUTAÇÃOUFRNBrasilinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRNinstname:Universidade Federal do Rio Grande do Norte (UFRN)instacron:UFRNTEXTFredDeCastroSantos_DISSERT.pdf.txtFredDeCastroSantos_DISSERT.pdf.txtExtracted texttext/plain124580https://repositorio.ufrn.br/bitstream/123456789/24970/2/FredDeCastroSantos_DISSERT.pdf.txtac06e9a68284056f7b8ecd0a729ba76aMD52THUMBNAILFredDeCastroSantos_DISSERT.pdf.jpgFredDeCastroSantos_DISSERT.pdf.jpgIM Thumbnailimage/jpeg2974https://repositorio.ufrn.br/bitstream/123456789/24970/3/FredDeCastroSantos_DISSERT.pdf.jpge6e873db864f2bd484ef9449b978bb0fMD53ORIGINALFredDeCastroSantos_DISSERT.pdfFredDeCastroSantos_DISSERT.pdfapplication/pdf1940661https://repositorio.ufrn.br/bitstream/123456789/24970/1/FredDeCastroSantos_DISSERT.pdf7cd19a0adff2dc7261f668027656da45MD51123456789/249702019-01-30 17:38:36.484oai:https://repositorio.ufrn.br:123456789/24970Repositório de PublicaçõesPUBhttp://repositorio.ufrn.br/oai/opendoar:2019-01-30T20:38:36Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)false |
dc.title.pt_BR.fl_str_mv |
A mechanism to evaluate context-free queries inspired in LR(1) parsers over graph databases |
title |
A mechanism to evaluate context-free queries inspired in LR(1) parsers over graph databases |
spellingShingle |
A mechanism to evaluate context-free queries inspired in LR(1) parsers over graph databases Santos, Fred de Castro CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO Bancos de Dados em Grafo Expressividade de linguagens de consulta RDF Linguagens LR(1) |
title_short |
A mechanism to evaluate context-free queries inspired in LR(1) parsers over graph databases |
title_full |
A mechanism to evaluate context-free queries inspired in LR(1) parsers over graph databases |
title_fullStr |
A mechanism to evaluate context-free queries inspired in LR(1) parsers over graph databases |
title_full_unstemmed |
A mechanism to evaluate context-free queries inspired in LR(1) parsers over graph databases |
title_sort |
A mechanism to evaluate context-free queries inspired in LR(1) parsers over graph databases |
author |
Santos, Fred de Castro |
author_facet |
Santos, Fred de Castro |
author_role |
author |
dc.contributor.authorID.pt_BR.fl_str_mv |
|
dc.contributor.advisorID.pt_BR.fl_str_mv |
|
dc.contributor.advisor-co1ID.pt_BR.fl_str_mv |
|
dc.contributor.referees1.none.fl_str_mv |
Oliveira, Marcel Vinicius Medeiros |
dc.contributor.referees1ID.pt_BR.fl_str_mv |
|
dc.contributor.referees2.none.fl_str_mv |
Bigonha, Mariza Andrade da Silva |
dc.contributor.referees2ID.pt_BR.fl_str_mv |
|
dc.contributor.referees3.none.fl_str_mv |
Medeiros, Sérgio Queiroz de |
dc.contributor.referees3ID.pt_BR.fl_str_mv |
|
dc.contributor.author.fl_str_mv |
Santos, Fred de Castro |
dc.contributor.advisor-co1.fl_str_mv |
Musicante, Martin Alejandro |
dc.contributor.advisor1.fl_str_mv |
Costa, Umberto Souza da |
contributor_str_mv |
Musicante, Martin Alejandro Costa, Umberto Souza da |
dc.subject.cnpq.fl_str_mv |
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO |
topic |
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO Bancos de Dados em Grafo Expressividade de linguagens de consulta RDF Linguagens LR(1) |
dc.subject.por.fl_str_mv |
Bancos de Dados em Grafo Expressividade de linguagens de consulta RDF Linguagens LR(1) |
description |
A World Wide Web é uma coleção de informações sempre crescente. Esta informação é distribuída entre documentos diferentes, disponibilizados através do HTTP. Mesmo que essa informação seja acessível aos usuários na forma de artigos de notícias, transmissões de áudio, imagens e vídeos, os agentes de software geralmente não podem classificá-la. A falta de informações semânticas sobre esses documentos em um formato legível por máquina geralmente faz com que a análise seja imprecisa. Um número significativo de entidades adotaram Linked Data como uma forma de adicionar informações semânticas aos seus dados, e não apenas publicá-lo na Web. O resultado é uma coleção global de dados, chamada Web of Data, que forma um grafo global, composto por declarações no formato RDF [22] de diversas fontes, cobrindo todos os tipos de tópicos. Para encontrar informações específicas nesses grafos, as consultas são realizadas começando em um sujeito e analisando seus predicados nas instruções RDF. Esses predicados são as conexões entre o sujeito e o objeto, e um conjunto de trilhas forma um caminho de informação. O uso de HTTP como mecanismo padrão de acesso a dados e RDF como modelo de dados padrão simplifica o acesso a dados, o que nos motiva a pesquisar alternativas na forma como esses dados são buscados. Uma vez que a maioria das linguagens de consulta de banco de dados de grafo estão na classe de Linguagens Regulares, nós propomos seguir um caminho diferente e tentar usar uma classe de gramática menos restritiva, chamada Gramática Livre de Contexto Determinística, para aumentar a expressividade das consultas no banco de dados em grafo. Mais especificamente, aplicando o método de análise LR(1) para encontrar caminhos em um banco de dados de grafo RDF. O principal objetivo deste trabalho é prover meios para se permitir a utilização de técnicas de reconhecimento de gramáticas livres de contexto LR(1) para fazer consultas por caminhos formados pelas etiquetas das arestas em um banco de dados RDF. Fornecendo, como um resultado, uma ferramenta que se permita atingir melhor expressividade, eficiência e escalabilidade nestas consultas do que o que existe atualmente. Para atingir este objetivo, nós implementamos um algoritmo baseado nas técnicas de reconhecimento LR(1), usando o GSS [30] ao invés de uma pilha, e permitimos ao usuário fazer consultas com uma gramática livre de contexto (LR1). Também analisamos a complexidade do nosso algoritmo e executamos alguns experimentos, comparando nossa solução com as outras propostas na literatura, mostrando que a nossa pode ter melhor desempenho em alguns cenários. |
publishDate |
2018 |
dc.date.accessioned.fl_str_mv |
2018-04-04T12:11:32Z |
dc.date.available.fl_str_mv |
2018-04-04T12:11:32Z |
dc.date.issued.fl_str_mv |
2018-02-23 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
SANTOS, Fred de Castro. A mechanism to evaluate context-free queries inspired in LR(1) parsers over graph databases. 2018. 85f. Dissertação (Mestrado em Sistemas e Computação) - Centro de Ciências Exatas e da Terra, Universidade Federal do Rio Grande do Norte, Natal, 2018. |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufrn.br/jspui/handle/123456789/24970 |
identifier_str_mv |
SANTOS, Fred de Castro. A mechanism to evaluate context-free queries inspired in LR(1) parsers over graph databases. 2018. 85f. Dissertação (Mestrado em Sistemas e Computação) - Centro de Ciências Exatas e da Terra, Universidade Federal do Rio Grande do Norte, Natal, 2018. |
url |
https://repositorio.ufrn.br/jspui/handle/123456789/24970 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.program.fl_str_mv |
PROGRAMA DE PÓS-GRADUAÇÃO EM SISTEMAS E COMPUTAÇÃO |
dc.publisher.initials.fl_str_mv |
UFRN |
dc.publisher.country.fl_str_mv |
Brasil |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFRN instname:Universidade Federal do Rio Grande do Norte (UFRN) instacron:UFRN |
instname_str |
Universidade Federal do Rio Grande do Norte (UFRN) |
instacron_str |
UFRN |
institution |
UFRN |
reponame_str |
Repositório Institucional da UFRN |
collection |
Repositório Institucional da UFRN |
bitstream.url.fl_str_mv |
https://repositorio.ufrn.br/bitstream/123456789/24970/2/FredDeCastroSantos_DISSERT.pdf.txt https://repositorio.ufrn.br/bitstream/123456789/24970/3/FredDeCastroSantos_DISSERT.pdf.jpg https://repositorio.ufrn.br/bitstream/123456789/24970/1/FredDeCastroSantos_DISSERT.pdf |
bitstream.checksum.fl_str_mv |
ac06e9a68284056f7b8ecd0a729ba76a e6e873db864f2bd484ef9449b978bb0f 7cd19a0adff2dc7261f668027656da45 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN) |
repository.mail.fl_str_mv |
|
_version_ |
1802117888697434112 |