Uma Ferramenta para Extração de Esquemas de Bancos de Dados NoSQL Orientados a Documentos

Detalhes bibliográficos
Autor(a) principal: Costa, Felipe de Souza da
Data de Publicação: 2017
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UFSC
Texto Completo: https://repositorio.ufsc.br/xmlui/handle/123456789/182209
Resumo: TCC(graduação) - Universidade Federal de Santa Catarina. Centro Tecnológico. Sistemas de Informação.
id UFSC_5ad014b21c11d47cc08c235d2083c4bb
oai_identifier_str oai:repositorio.ufsc.br:123456789/182209
network_acronym_str UFSC
network_name_str Repositório Institucional da UFSC
repository_id_str 2373
spelling Uma Ferramenta para Extração de Esquemas de Bancos de Dados NoSQL Orientados a DocumentosExtração de esquemasNoSQLBanco de Dados orientado a documentosJSONJSON SchemaTCC(graduação) - Universidade Federal de Santa Catarina. Centro Tecnológico. Sistemas de Informação.Os bancos de dados NoSQL têm se tornando cada vez mais populares no desenvolvimento de aplicações, entre outras características, devido à sua capacidade de lidar com grandes volumes de dados e pela ausência de um esquema de dados explícito. Embora a maioria dos bancos de dados NoSQL não tenha esquema, as informações sobre as propriedades estruturais dos dados persistidos são essenciais durante o desenvolvimento de aplicações. Sem o conhecimento dessas propriedades estruturais, atividades de desenvolvimento de aplicações ou análise de dados tornam- se um trabalho custoso e, às vezes, impraticáveis. Sendo assim, o presente trabalho propõe o desenvolvimento de uma ferramenta que extraia o esquema de uma coleção de documentos no formato JSON, armazenados em um banco de dados NoSQL orientado a documentos, com o objetivo de facilitar diversas tarefas de manipulação posterior desses dados, como a recuperação, validação, integração e análise de dados. Na fase de extração das estruturas dos documentos são aplicadas operações de agregação visando obter um documento para cada estrutura distinta e também é proposta uma estrutura global para agrupar essas estruturas a fim de gerar um único esquema no formato JSON Schema. Finalmente, experimentos realizados em datasets reais do DBPedia, Foursquare e GitHub, além de um dataset hipotético, demonstram que os resultados de tempo de processamento e a completude dos esquemas gerados são comparáveis com os resultados encontrados em abordagens do estado da arte.NoSQL databases are becoming increasingly popular in application development, among other features, because of their ability to handle large data volumes and also their ability to be schemaless. Although most NoSQL databases are schemaless, information about the structural properties of stored data is essential during the application development. Without the knowledge of these structural properties, application development or data analysis activities become costly and sometimes unfeasible. Thus, this work proposes a tool that, given a collection of data in JSON format, stored in a document-oriented NoSQL database, performs the extraction of its schema, with the purpose of facilitating further data manipulation tasks, like data retrieval, integration, validation and analysis. In the extraction phase of the document structure, aggregation operations are applied to obtain a document for each distinct structure. Besides, a global structure is proposed to group these structures in order to present a single schema in JSON Schema format. Finally, experiments based on real DBPedia, Foursquare and GitHub datasets, as well as a hypothetical dataset, demonstrate that the results of processing time and completeness of the schemes generated are comparable with the results found in state of the art approaches.Florianópolis, SCMello, Ronaldo dos SantosFrozza, Angelo AugustoUniversidade Federal de Santa CatarinaCosta, Felipe de Souza da2017-12-13T21:06:11Z2017-12-13T21:06:11Z2017-11-21info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesis274 f.application/pdfhttps://repositorio.ufsc.br/xmlui/handle/123456789/182209porreponame:Repositório Institucional da UFSCinstname:Universidade Federal de Santa Catarina (UFSC)instacron:UFSCinfo:eu-repo/semantics/openAccess2017-12-13T21:06:11Zoai:repositorio.ufsc.br:123456789/182209Repositório InstitucionalPUBhttp://150.162.242.35/oai/requestopendoar:23732017-12-13T21:06:11Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)false
dc.title.none.fl_str_mv Uma Ferramenta para Extração de Esquemas de Bancos de Dados NoSQL Orientados a Documentos
title Uma Ferramenta para Extração de Esquemas de Bancos de Dados NoSQL Orientados a Documentos
spellingShingle Uma Ferramenta para Extração de Esquemas de Bancos de Dados NoSQL Orientados a Documentos
Costa, Felipe de Souza da
Extração de esquemas
NoSQL
Banco de Dados orientado a documentos
JSON
JSON Schema
title_short Uma Ferramenta para Extração de Esquemas de Bancos de Dados NoSQL Orientados a Documentos
title_full Uma Ferramenta para Extração de Esquemas de Bancos de Dados NoSQL Orientados a Documentos
title_fullStr Uma Ferramenta para Extração de Esquemas de Bancos de Dados NoSQL Orientados a Documentos
title_full_unstemmed Uma Ferramenta para Extração de Esquemas de Bancos de Dados NoSQL Orientados a Documentos
title_sort Uma Ferramenta para Extração de Esquemas de Bancos de Dados NoSQL Orientados a Documentos
author Costa, Felipe de Souza da
author_facet Costa, Felipe de Souza da
author_role author
dc.contributor.none.fl_str_mv Mello, Ronaldo dos Santos
Frozza, Angelo Augusto
Universidade Federal de Santa Catarina
dc.contributor.author.fl_str_mv Costa, Felipe de Souza da
dc.subject.por.fl_str_mv Extração de esquemas
NoSQL
Banco de Dados orientado a documentos
JSON
JSON Schema
topic Extração de esquemas
NoSQL
Banco de Dados orientado a documentos
JSON
JSON Schema
description TCC(graduação) - Universidade Federal de Santa Catarina. Centro Tecnológico. Sistemas de Informação.
publishDate 2017
dc.date.none.fl_str_mv 2017-12-13T21:06:11Z
2017-12-13T21:06:11Z
2017-11-21
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.ufsc.br/xmlui/handle/123456789/182209
url https://repositorio.ufsc.br/xmlui/handle/123456789/182209
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 274 f.
application/pdf
dc.publisher.none.fl_str_mv Florianópolis, SC
publisher.none.fl_str_mv Florianópolis, SC
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSC
instname:Universidade Federal de Santa Catarina (UFSC)
instacron:UFSC
instname_str Universidade Federal de Santa Catarina (UFSC)
instacron_str UFSC
institution UFSC
reponame_str Repositório Institucional da UFSC
collection Repositório Institucional da UFSC
repository.name.fl_str_mv Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)
repository.mail.fl_str_mv
_version_ 1808651912466137088