Análise comparativa de benchmarks para banco de dados NoSQL orientados a grafos de propriedades
Autor(a) principal: | |
---|---|
Data de Publicação: | 2021 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFSCAR |
Texto Completo: | https://repositorio.ufscar.br/handle/ufscar/16139 |
Resumo: | The new era of data economics, based on data sets with enormous volume, wide variety of formats, and rapid speed in data production and utilization, has brought the need for new data management structures and methods. Then come Not Only SQL (NoSQL) databases, which provide a new way of storing and retrieving data with features that go beyond relational database management systems. NoSQL databases are divided into four major models: key -value, column-oriented, document-oriented and graph-oriented. They are able to scalably handle the storage and processing of gigantic volumes of data with a flexible format, where manipulations are not exclusively performed through the SQL language. These data sets, many of which, modeled as large graphs, to - a challenge for industry and academia, which has been increasingly committed to research and innovation in the area. Thus, there is a natural increase in demand for performance analysis systems for Graph Oriented NoSQL Databases. This implies the need for new benchmarks capable of testing these new technologies and that guide users to identify tools that best adapt to their applications. Many studies approach the proposal of benchmarks for an analysis of Graph Oriented NoSQL Database systems. However, no study studies the comparison of such benchmarks. Thus, this Master's research work aimed to carry out a comparative analysis of benchmarks for performance evaluation of Graph Oriented NoSQL Databases, with specific emphasis on the property graph model, and thus highlight as main differences between these, in addition to identifying strengths and limitations of each benchmark. Thus, it becomes possible to identify the most appropriate benchmark to analyze the performance of Property Graph-Oriented NoSQL Database systems according to a set of requirements of a specific domain. Application. Among the several existing benchmarks, it was investigated to compare the LDBC SNB, XGDBench, HPC-SGAB, TGDB and Cyclone benchmarks. In general terms, the LDBC-SNB benchmark stood out in relation to the other benchmarks, especially when it comes to query types and performance measures, and because of its tester support for several graph-oriented NoSQL DBMS's. |
id |
SCAR_3b11c311b5b775b13706d81edcd0054d |
---|---|
oai_identifier_str |
oai:repositorio.ufscar.br:ufscar/16139 |
network_acronym_str |
SCAR |
network_name_str |
Repositório Institucional da UFSCAR |
repository_id_str |
4322 |
spelling |
Silva, Laís Bethânia BritoCiferri, Ricardo Rodrigueshttp://lattes.cnpq.br/8382221522817502http://lattes.cnpq.br/2331554659302226f1c97f63-bee8-4c11-a2a2-ff1f15c8df8b2022-05-17T13:28:28Z2022-05-17T13:28:28Z2021-07-06SILVA, Laís Bethânia Brito. Análise comparativa de benchmarks para banco de dados NoSQL orientados a grafos de propriedades. 2021. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2021. Disponível em: https://repositorio.ufscar.br/handle/ufscar/16139.https://repositorio.ufscar.br/handle/ufscar/16139The new era of data economics, based on data sets with enormous volume, wide variety of formats, and rapid speed in data production and utilization, has brought the need for new data management structures and methods. Then come Not Only SQL (NoSQL) databases, which provide a new way of storing and retrieving data with features that go beyond relational database management systems. NoSQL databases are divided into four major models: key -value, column-oriented, document-oriented and graph-oriented. They are able to scalably handle the storage and processing of gigantic volumes of data with a flexible format, where manipulations are not exclusively performed through the SQL language. These data sets, many of which, modeled as large graphs, to - a challenge for industry and academia, which has been increasingly committed to research and innovation in the area. Thus, there is a natural increase in demand for performance analysis systems for Graph Oriented NoSQL Databases. This implies the need for new benchmarks capable of testing these new technologies and that guide users to identify tools that best adapt to their applications. Many studies approach the proposal of benchmarks for an analysis of Graph Oriented NoSQL Database systems. However, no study studies the comparison of such benchmarks. Thus, this Master's research work aimed to carry out a comparative analysis of benchmarks for performance evaluation of Graph Oriented NoSQL Databases, with specific emphasis on the property graph model, and thus highlight as main differences between these, in addition to identifying strengths and limitations of each benchmark. Thus, it becomes possible to identify the most appropriate benchmark to analyze the performance of Property Graph-Oriented NoSQL Database systems according to a set of requirements of a specific domain. Application. Among the several existing benchmarks, it was investigated to compare the LDBC SNB, XGDBench, HPC-SGAB, TGDB and Cyclone benchmarks. In general terms, the LDBC-SNB benchmark stood out in relation to the other benchmarks, especially when it comes to query types and performance measures, and because of its tester support for several graph-oriented NoSQL DBMS's.A nova era da economia de dados, baseada em conjuntos de dados com enorme volume, grande variedade de formatos e rápida velocidade na produção e utilização de dados, trouxe a necessidade de novas estruturas e métodos de gerenciamento de dados. Surgem então os bancos de dados Not Only SQL (NoSQL), que fornecem uma nova forma de armazenamento e recuperação dedados com capacidades que vão além dos sistemas gerenciadores de bancos de dados relacionais.Bancos de dados NoSQL são divididos em quatro grandes modelos: chave-valor, orientados à colunas, orientados a documentos e orientados a grafos. São capazes de lidar de forma escalável com o armazenamento e o processamento de gigantescos volumes de dados com formato flexível, onde as manipulações não são exclusivamente realizadas por meio da linguagem SQL. Esses conjuntos de dados, muitos dos quais, modelados como grandes grafos, tornaram-se um desafio para a indústria e a academia, que vem se empenhando cada vez mais em pesquisa e inovação na área. Assim, naturalmente ocorre o aumento da demanda por sistemas de análise de desempenho de Bancos de Dados NoSQL Orientados a Grafos. Isso implica na necessidade de novos benchmarks capazes de testar essas novas tecnologias e que orientemos usuários a identificar as ferramentas que melhor se adéquem às suas aplicações. Muitos estudos têm abordado a proposta de benchmarks para a análise dos sistemas de Bancos de Dados NoSQL Orientados a Grafos. Porém, nenhum estudo descreve a comparação detalhada desses benchmarks. Dessa forma, este trabalho de pesquisa de Mestrado teve por objetivo realizar uma análise comparativa de benchmarks para avaliação de desempenho de Bancos de Dados NoSQL Orientados a Grafos, com ênfase especificamente no modelo de grafos de propriedade, e assim destacar as principais diferenças entre esses, além de identificar pontos positivos e limitações de cada benchmark. Assim, torna-se possível identificar o benchmark mais adequado para analisar o desempenho de sistemas de Bancos de Dados NoSQL Orientados a Grafos de Propriedades em função de um conjunto de requisitos de um domínio específico de aplicação. Dentre os diversos benchmarks existentes, foi investigada a relevância dos benchmarks LDBC SNB, XGDBench, HPC, TGDB e Cyclone. Em termos gerais, o benchmark LDBC-SNB se sobressaiu em relação aos outros benchmarks, principalmente quando se trata dos tipos de consultas e medidas de desempenho e por prover suporte a diversos SGBD’s NoSQL orientados a grafos.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)CAPES/DS (01/08/2018 a 17/07/2020)porUniversidade Federal de São CarlosCâmpus São CarlosPrograma de Pós-Graduação em Ciência da Computação - PPGCCUFSCarAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessAnálise de desempenhoBanco de dadosNoSQLBanco de dados orientados a grafos de propriedadeAnálise comparativaBenchmarkPerformance analysisDatabasesNoSQLGraph databaseProperty graphComparative analysisCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAOAnálise comparativa de benchmarks para banco de dados NoSQL orientados a grafos de propriedadesBenchmarks benchmark analysis for property graph oriented NoSQL databaseinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis6006003b1d5172-8bf0-4d0b-8777-ab82599bbf09reponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARORIGINALDissertcao_final_Lais_Silva.pdfDissertcao_final_Lais_Silva.pdfDissertaçãoapplication/pdf1933158https://repositorio.ufscar.br/bitstream/ufscar/16139/1/Dissertcao_final_Lais_Silva.pdf2fb6f640a7d18eb63b76bffbbdf72f6dMD51CA.pdfCA.pdfapplication/pdf372900https://repositorio.ufscar.br/bitstream/ufscar/16139/9/CA.pdf0973500022f5611efd18ddd55ae19fb2MD59CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://repositorio.ufscar.br/bitstream/ufscar/16139/10/license_rdfe39d27027a6cc9cb039ad269a5db8e34MD510TEXTDissertcao_final_Lais_Silva.pdf.txtDissertcao_final_Lais_Silva.pdf.txtExtracted texttext/plain188316https://repositorio.ufscar.br/bitstream/ufscar/16139/11/Dissertcao_final_Lais_Silva.pdf.txt6e4a3bba04321eaa1b5cb5db84c7073fMD511CA.pdf.txtCA.pdf.txtExtracted texttext/plain1https://repositorio.ufscar.br/bitstream/ufscar/16139/13/CA.pdf.txt68b329da9893e34099c7d8ad5cb9c940MD513THUMBNAILDissertcao_final_Lais_Silva.pdf.jpgDissertcao_final_Lais_Silva.pdf.jpgIM Thumbnailimage/jpeg9019https://repositorio.ufscar.br/bitstream/ufscar/16139/12/Dissertcao_final_Lais_Silva.pdf.jpgb2b93e566b9a52af13e30e63797442d7MD512CA.pdf.jpgCA.pdf.jpgIM Thumbnailimage/jpeg13059https://repositorio.ufscar.br/bitstream/ufscar/16139/14/CA.pdf.jpg42d9f35abeae25474bc18f479e9d0455MD514ufscar/161392023-09-18 18:32:21.244oai:repositorio.ufscar.br:ufscar/16139Repositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestopendoar:43222023-09-18T18:32:21Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false |
dc.title.por.fl_str_mv |
Análise comparativa de benchmarks para banco de dados NoSQL orientados a grafos de propriedades |
dc.title.alternative.eng.fl_str_mv |
Benchmarks benchmark analysis for property graph oriented NoSQL database |
title |
Análise comparativa de benchmarks para banco de dados NoSQL orientados a grafos de propriedades |
spellingShingle |
Análise comparativa de benchmarks para banco de dados NoSQL orientados a grafos de propriedades Silva, Laís Bethânia Brito Análise de desempenho Banco de dados NoSQL Banco de dados orientados a grafos de propriedade Análise comparativa Benchmark Performance analysis Databases NoSQL Graph database Property graph Comparative analysis CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO |
title_short |
Análise comparativa de benchmarks para banco de dados NoSQL orientados a grafos de propriedades |
title_full |
Análise comparativa de benchmarks para banco de dados NoSQL orientados a grafos de propriedades |
title_fullStr |
Análise comparativa de benchmarks para banco de dados NoSQL orientados a grafos de propriedades |
title_full_unstemmed |
Análise comparativa de benchmarks para banco de dados NoSQL orientados a grafos de propriedades |
title_sort |
Análise comparativa de benchmarks para banco de dados NoSQL orientados a grafos de propriedades |
author |
Silva, Laís Bethânia Brito |
author_facet |
Silva, Laís Bethânia Brito |
author_role |
author |
dc.contributor.authorlattes.por.fl_str_mv |
http://lattes.cnpq.br/2331554659302226 |
dc.contributor.author.fl_str_mv |
Silva, Laís Bethânia Brito |
dc.contributor.advisor1.fl_str_mv |
Ciferri, Ricardo Rodrigues |
dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/8382221522817502 |
dc.contributor.authorID.fl_str_mv |
f1c97f63-bee8-4c11-a2a2-ff1f15c8df8b |
contributor_str_mv |
Ciferri, Ricardo Rodrigues |
dc.subject.por.fl_str_mv |
Análise de desempenho Banco de dados NoSQL Banco de dados orientados a grafos de propriedade Análise comparativa |
topic |
Análise de desempenho Banco de dados NoSQL Banco de dados orientados a grafos de propriedade Análise comparativa Benchmark Performance analysis Databases NoSQL Graph database Property graph Comparative analysis CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO |
dc.subject.eng.fl_str_mv |
Benchmark Performance analysis Databases NoSQL Graph database Property graph Comparative analysis |
dc.subject.cnpq.fl_str_mv |
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO |
description |
The new era of data economics, based on data sets with enormous volume, wide variety of formats, and rapid speed in data production and utilization, has brought the need for new data management structures and methods. Then come Not Only SQL (NoSQL) databases, which provide a new way of storing and retrieving data with features that go beyond relational database management systems. NoSQL databases are divided into four major models: key -value, column-oriented, document-oriented and graph-oriented. They are able to scalably handle the storage and processing of gigantic volumes of data with a flexible format, where manipulations are not exclusively performed through the SQL language. These data sets, many of which, modeled as large graphs, to - a challenge for industry and academia, which has been increasingly committed to research and innovation in the area. Thus, there is a natural increase in demand for performance analysis systems for Graph Oriented NoSQL Databases. This implies the need for new benchmarks capable of testing these new technologies and that guide users to identify tools that best adapt to their applications. Many studies approach the proposal of benchmarks for an analysis of Graph Oriented NoSQL Database systems. However, no study studies the comparison of such benchmarks. Thus, this Master's research work aimed to carry out a comparative analysis of benchmarks for performance evaluation of Graph Oriented NoSQL Databases, with specific emphasis on the property graph model, and thus highlight as main differences between these, in addition to identifying strengths and limitations of each benchmark. Thus, it becomes possible to identify the most appropriate benchmark to analyze the performance of Property Graph-Oriented NoSQL Database systems according to a set of requirements of a specific domain. Application. Among the several existing benchmarks, it was investigated to compare the LDBC SNB, XGDBench, HPC-SGAB, TGDB and Cyclone benchmarks. In general terms, the LDBC-SNB benchmark stood out in relation to the other benchmarks, especially when it comes to query types and performance measures, and because of its tester support for several graph-oriented NoSQL DBMS's. |
publishDate |
2021 |
dc.date.issued.fl_str_mv |
2021-07-06 |
dc.date.accessioned.fl_str_mv |
2022-05-17T13:28:28Z |
dc.date.available.fl_str_mv |
2022-05-17T13:28:28Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
SILVA, Laís Bethânia Brito. Análise comparativa de benchmarks para banco de dados NoSQL orientados a grafos de propriedades. 2021. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2021. Disponível em: https://repositorio.ufscar.br/handle/ufscar/16139. |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufscar.br/handle/ufscar/16139 |
identifier_str_mv |
SILVA, Laís Bethânia Brito. Análise comparativa de benchmarks para banco de dados NoSQL orientados a grafos de propriedades. 2021. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2021. Disponível em: https://repositorio.ufscar.br/handle/ufscar/16139. |
url |
https://repositorio.ufscar.br/handle/ufscar/16139 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.confidence.fl_str_mv |
600 600 |
dc.relation.authority.fl_str_mv |
3b1d5172-8bf0-4d0b-8777-ab82599bbf09 |
dc.rights.driver.fl_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de São Carlos Câmpus São Carlos |
dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Ciência da Computação - PPGCC |
dc.publisher.initials.fl_str_mv |
UFSCar |
publisher.none.fl_str_mv |
Universidade Federal de São Carlos Câmpus São Carlos |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFSCAR instname:Universidade Federal de São Carlos (UFSCAR) instacron:UFSCAR |
instname_str |
Universidade Federal de São Carlos (UFSCAR) |
instacron_str |
UFSCAR |
institution |
UFSCAR |
reponame_str |
Repositório Institucional da UFSCAR |
collection |
Repositório Institucional da UFSCAR |
bitstream.url.fl_str_mv |
https://repositorio.ufscar.br/bitstream/ufscar/16139/1/Dissertcao_final_Lais_Silva.pdf https://repositorio.ufscar.br/bitstream/ufscar/16139/9/CA.pdf https://repositorio.ufscar.br/bitstream/ufscar/16139/10/license_rdf https://repositorio.ufscar.br/bitstream/ufscar/16139/11/Dissertcao_final_Lais_Silva.pdf.txt https://repositorio.ufscar.br/bitstream/ufscar/16139/13/CA.pdf.txt https://repositorio.ufscar.br/bitstream/ufscar/16139/12/Dissertcao_final_Lais_Silva.pdf.jpg https://repositorio.ufscar.br/bitstream/ufscar/16139/14/CA.pdf.jpg |
bitstream.checksum.fl_str_mv |
2fb6f640a7d18eb63b76bffbbdf72f6d 0973500022f5611efd18ddd55ae19fb2 e39d27027a6cc9cb039ad269a5db8e34 6e4a3bba04321eaa1b5cb5db84c7073f 68b329da9893e34099c7d8ad5cb9c940 b2b93e566b9a52af13e30e63797442d7 42d9f35abeae25474bc18f479e9d0455 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR) |
repository.mail.fl_str_mv |
|
_version_ |
1802136400582148096 |