Um estudo do impacto da modelagem de dados no desempenho de consultas nos SGBD NoSQL orientados a documentos

Detalhes bibliográficos
Autor(a) principal: Soransso, Raphael Augusto da Silva Nunes
Data de Publicação: 2017
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da Produção Científica da Marinha do Brasil (RI-MB)
Texto Completo: http://www.repositorio.mar.mil.br/handle/ripcmb/844352
Resumo: Os SGBD NoSQL surgiram como solução alternativa às limitações dos SGBD Relacionais, com relação ao gerenciamento do crescente volume de dados, e ao seu tratamento distribuído. Esses sistemas além de possuir uma maior facilidade em distribuir os seus dados, permitem uma maior flexibilidade de esquema e são mais tolerantes à inconsistência. Da mesma forma que nos SGBD relacionais, a modelagem lógica dos dados pode influenciar significativamente o desempenho neste tipo de SGBD. Em especial, quando o objetivo é atender aplicações analíticas. Apesar de existir em alguns trabalhos que buscam orientar a modelagem de dados nos SGBD NoSQL e trabalhos que realizam a avaliação da performance desses sistemas, até onde foi possível investigar, não foram encontrados na literatura trabalhos que demonstrem o quanto as diferentes formas de modelagem dos dados, e mais especificamente da modelagem dos agregados nos SGBD orientados a documentos, podem influenciar no desempenho das consultas neste tipo de sistema. Sem tais estudos,torna-se difícil identificar a melhor alternativa de modelagem de agregados, de forma a melhorar o desempenho das consultas. Assim, o presente trabalho tem como objetivo preencher esta lacuna e fornecer aos administradores de bancos de dados, orientações de como os dados podem ser modelados de forma a obter melhor desempenho em SGBD orientados a documentos, para consultas analíticas. Para tanto, foram realizados experimentos em cinco SGBD orientados a documentos, utilizando um conjunto de dados, oriundo de um conhecido benchmark voltado para aplicações de suporte à decisão. A partir dos resultados dos experimentos foi possível propor heurísticas de modelagem de dados, em algumas das implementações de SGBD estudadas, que foram validadas em outro conjunto de dados oriundo de outro benchmark com objetivos similares ao primeiro. No final do trabalho, foram realizados ainda, um estudo complementar sobre o impacto da modelagem dos agregados na performance das consultas, ao utilizar o recurso de índices, e uma comparação de desempenho entre as implementações estudadas.
id MB_2fa87b5816eaadd5c604cc85bd4543b8
oai_identifier_str oai:www.repositorio.mar.mil.br:ripcmb/844352
network_acronym_str MB
network_name_str Repositório Institucional da Produção Científica da Marinha do Brasil (RI-MB)
repository_id_str
spelling Cavalcanti, Maria Cláudia ReisSoransso, Raphael Augusto da Silva NunesCavalcanti, Maria Cláudia Reis2020-01-14T13:37:25Z2020-01-14T13:37:25Z2017http://www.repositorio.mar.mil.br/handle/ripcmb/844352Os SGBD NoSQL surgiram como solução alternativa às limitações dos SGBD Relacionais, com relação ao gerenciamento do crescente volume de dados, e ao seu tratamento distribuído. Esses sistemas além de possuir uma maior facilidade em distribuir os seus dados, permitem uma maior flexibilidade de esquema e são mais tolerantes à inconsistência. Da mesma forma que nos SGBD relacionais, a modelagem lógica dos dados pode influenciar significativamente o desempenho neste tipo de SGBD. Em especial, quando o objetivo é atender aplicações analíticas. Apesar de existir em alguns trabalhos que buscam orientar a modelagem de dados nos SGBD NoSQL e trabalhos que realizam a avaliação da performance desses sistemas, até onde foi possível investigar, não foram encontrados na literatura trabalhos que demonstrem o quanto as diferentes formas de modelagem dos dados, e mais especificamente da modelagem dos agregados nos SGBD orientados a documentos, podem influenciar no desempenho das consultas neste tipo de sistema. Sem tais estudos,torna-se difícil identificar a melhor alternativa de modelagem de agregados, de forma a melhorar o desempenho das consultas. Assim, o presente trabalho tem como objetivo preencher esta lacuna e fornecer aos administradores de bancos de dados, orientações de como os dados podem ser modelados de forma a obter melhor desempenho em SGBD orientados a documentos, para consultas analíticas. Para tanto, foram realizados experimentos em cinco SGBD orientados a documentos, utilizando um conjunto de dados, oriundo de um conhecido benchmark voltado para aplicações de suporte à decisão. A partir dos resultados dos experimentos foi possível propor heurísticas de modelagem de dados, em algumas das implementações de SGBD estudadas, que foram validadas em outro conjunto de dados oriundo de outro benchmark com objetivos similares ao primeiro. No final do trabalho, foram realizados ainda, um estudo complementar sobre o impacto da modelagem dos agregados na performance das consultas, ao utilizar o recurso de índices, e uma comparação de desempenho entre as implementações estudadas.Dissertação de Mestrado apresentada ao Curso de Mestrado em Sistemas e Computação do Instituto Militar de Engenharia, como requisito parcial para a obtenção do título de Mestre em Ciências em Sistemas e Computação.NoSQL DBMS emerged to address the Relational DBMS limitations with respect to the management of large volumes of data in distributed environments. Similarly to the Relational DBMS,thelogical modellingonthiskindofdatabasesystem, cansignificantly influence its performance, especially when its focus is on answering analytical queries. Whereas there are some works that provide guidance to the data modelling or that focus on measuring the performance of NoSQL DBMS, there is a lack of works that demonstrate how much the different ways of data modelling,mainly the aggregate modelling, influence the query performance on this kind of document-store database system. Due to this absence, it becomes difficult to identify the best data modelling alternative, i.e., that would improve query performance. Thus, the present work aims to fulfill this gapand provide data modelling orientation to the database administrators, to increase the performance of document store databases on analytical queries. For this to happen, experiments on five document oriented NoSQL DBMS were performed, using a dataset originated from a well known benchmark for decision support applications. From the experiments results it was possible to propose data modelling heuristics for some of the studied databases. These heuristics were then validated on another dataset, originated from another benchmark with similar objectives of the first one. At the end of the work, two complementary studies were done: on the aggregate modelling impact on query perfomance, when indexes are used, and a performance comparison among some of the studied DBMS implementations.porInstituto Militar de Engenharia (IME)BenchmarkNoSQLModelagem de DadosUm estudo do impacto da modelagem de dados no desempenho de consultas nos SGBD NoSQL orientados a documentosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisBrasilinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da Produção Científica da Marinha do Brasil (RI-MB)instname:Marinha do Brasil (MB)instacron:MBTEXTDissertacao_Soransso.pdf.txtDissertacao_Soransso.pdf.txtExtracted texttext/plain300600https://www.repositorio.mar.mil.br/bitstream/ripcmb/844352/2/Dissertacao_Soransso.pdf.txt3c70e8291b11a28abf6f4bbc0817816cMD52THUMBNAILDissertacao_Soransso.pdf.jpgDissertacao_Soransso.pdf.jpgGenerated Thumbnailimage/jpeg1339https://www.repositorio.mar.mil.br/bitstream/ripcmb/844352/3/Dissertacao_Soransso.pdf.jpg0d49512a24ef7d6f5d2216f0a73c09aaMD53ORIGINALDissertacao_Soransso.pdfDissertacao_Soransso.pdfapplication/pdf4094602https://www.repositorio.mar.mil.br/bitstream/ripcmb/844352/1/Dissertacao_Soransso.pdf12c5c2d9d757701d2ecfdf7085b57a2fMD51ripcmb/8443522022-09-23 17:14:03.597oai:www.repositorio.mar.mil.br:ripcmb/844352Repositório InstitucionalPUBhttps://www.repositorio.mar.mil.br/oai/requestdphdm.repositorio@marinha.mil.bropendoar:2022-09-23T20:14:03Repositório Institucional da Produção Científica da Marinha do Brasil (RI-MB) - Marinha do Brasil (MB)false
dc.title.pt_BR.fl_str_mv Um estudo do impacto da modelagem de dados no desempenho de consultas nos SGBD NoSQL orientados a documentos
title Um estudo do impacto da modelagem de dados no desempenho de consultas nos SGBD NoSQL orientados a documentos
spellingShingle Um estudo do impacto da modelagem de dados no desempenho de consultas nos SGBD NoSQL orientados a documentos
Soransso, Raphael Augusto da Silva Nunes
Benchmark
NoSQL
Modelagem de Dados
title_short Um estudo do impacto da modelagem de dados no desempenho de consultas nos SGBD NoSQL orientados a documentos
title_full Um estudo do impacto da modelagem de dados no desempenho de consultas nos SGBD NoSQL orientados a documentos
title_fullStr Um estudo do impacto da modelagem de dados no desempenho de consultas nos SGBD NoSQL orientados a documentos
title_full_unstemmed Um estudo do impacto da modelagem de dados no desempenho de consultas nos SGBD NoSQL orientados a documentos
title_sort Um estudo do impacto da modelagem de dados no desempenho de consultas nos SGBD NoSQL orientados a documentos
author Soransso, Raphael Augusto da Silva Nunes
author_facet Soransso, Raphael Augusto da Silva Nunes
author_role author
dc.contributor.none.fl_str_mv Cavalcanti, Maria Cláudia Reis
dc.contributor.author.fl_str_mv Soransso, Raphael Augusto da Silva Nunes
dc.contributor.advisor1.fl_str_mv Cavalcanti, Maria Cláudia Reis
contributor_str_mv Cavalcanti, Maria Cláudia Reis
dc.subject.por.fl_str_mv Benchmark
NoSQL
Modelagem de Dados
topic Benchmark
NoSQL
Modelagem de Dados
description Os SGBD NoSQL surgiram como solução alternativa às limitações dos SGBD Relacionais, com relação ao gerenciamento do crescente volume de dados, e ao seu tratamento distribuído. Esses sistemas além de possuir uma maior facilidade em distribuir os seus dados, permitem uma maior flexibilidade de esquema e são mais tolerantes à inconsistência. Da mesma forma que nos SGBD relacionais, a modelagem lógica dos dados pode influenciar significativamente o desempenho neste tipo de SGBD. Em especial, quando o objetivo é atender aplicações analíticas. Apesar de existir em alguns trabalhos que buscam orientar a modelagem de dados nos SGBD NoSQL e trabalhos que realizam a avaliação da performance desses sistemas, até onde foi possível investigar, não foram encontrados na literatura trabalhos que demonstrem o quanto as diferentes formas de modelagem dos dados, e mais especificamente da modelagem dos agregados nos SGBD orientados a documentos, podem influenciar no desempenho das consultas neste tipo de sistema. Sem tais estudos,torna-se difícil identificar a melhor alternativa de modelagem de agregados, de forma a melhorar o desempenho das consultas. Assim, o presente trabalho tem como objetivo preencher esta lacuna e fornecer aos administradores de bancos de dados, orientações de como os dados podem ser modelados de forma a obter melhor desempenho em SGBD orientados a documentos, para consultas analíticas. Para tanto, foram realizados experimentos em cinco SGBD orientados a documentos, utilizando um conjunto de dados, oriundo de um conhecido benchmark voltado para aplicações de suporte à decisão. A partir dos resultados dos experimentos foi possível propor heurísticas de modelagem de dados, em algumas das implementações de SGBD estudadas, que foram validadas em outro conjunto de dados oriundo de outro benchmark com objetivos similares ao primeiro. No final do trabalho, foram realizados ainda, um estudo complementar sobre o impacto da modelagem dos agregados na performance das consultas, ao utilizar o recurso de índices, e uma comparação de desempenho entre as implementações estudadas.
publishDate 2017
dc.date.issued.fl_str_mv 2017
dc.date.accessioned.fl_str_mv 2020-01-14T13:37:25Z
dc.date.available.fl_str_mv 2020-01-14T13:37:25Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://www.repositorio.mar.mil.br/handle/ripcmb/844352
url http://www.repositorio.mar.mil.br/handle/ripcmb/844352
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Instituto Militar de Engenharia (IME)
publisher.none.fl_str_mv Instituto Militar de Engenharia (IME)
dc.source.none.fl_str_mv reponame:Repositório Institucional da Produção Científica da Marinha do Brasil (RI-MB)
instname:Marinha do Brasil (MB)
instacron:MB
instname_str Marinha do Brasil (MB)
instacron_str MB
institution MB
reponame_str Repositório Institucional da Produção Científica da Marinha do Brasil (RI-MB)
collection Repositório Institucional da Produção Científica da Marinha do Brasil (RI-MB)
bitstream.url.fl_str_mv https://www.repositorio.mar.mil.br/bitstream/ripcmb/844352/2/Dissertacao_Soransso.pdf.txt
https://www.repositorio.mar.mil.br/bitstream/ripcmb/844352/3/Dissertacao_Soransso.pdf.jpg
https://www.repositorio.mar.mil.br/bitstream/ripcmb/844352/1/Dissertacao_Soransso.pdf
bitstream.checksum.fl_str_mv 3c70e8291b11a28abf6f4bbc0817816c
0d49512a24ef7d6f5d2216f0a73c09aa
12c5c2d9d757701d2ecfdf7085b57a2f
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da Produção Científica da Marinha do Brasil (RI-MB) - Marinha do Brasil (MB)
repository.mail.fl_str_mv dphdm.repositorio@marinha.mil.br
_version_ 1798310211808657408