Uma Ferramenta para Extração de Esquemas de Bancos de Dados NoSQL Orientados a Documentos
Autor(a) principal: | |
---|---|
Data de Publicação: | 2017 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFSC |
Texto Completo: | https://repositorio.ufsc.br/xmlui/handle/123456789/182209 |
Resumo: | TCC(graduação) - Universidade Federal de Santa Catarina. Centro Tecnológico. Sistemas de Informação. |
id |
UFSC_5ad014b21c11d47cc08c235d2083c4bb |
---|---|
oai_identifier_str |
oai:repositorio.ufsc.br:123456789/182209 |
network_acronym_str |
UFSC |
network_name_str |
Repositório Institucional da UFSC |
repository_id_str |
2373 |
spelling |
Uma Ferramenta para Extração de Esquemas de Bancos de Dados NoSQL Orientados a DocumentosExtração de esquemasNoSQLBanco de Dados orientado a documentosJSONJSON SchemaTCC(graduação) - Universidade Federal de Santa Catarina. Centro Tecnológico. Sistemas de Informação.Os bancos de dados NoSQL têm se tornando cada vez mais populares no desenvolvimento de aplicações, entre outras características, devido à sua capacidade de lidar com grandes volumes de dados e pela ausência de um esquema de dados explícito. Embora a maioria dos bancos de dados NoSQL não tenha esquema, as informações sobre as propriedades estruturais dos dados persistidos são essenciais durante o desenvolvimento de aplicações. Sem o conhecimento dessas propriedades estruturais, atividades de desenvolvimento de aplicações ou análise de dados tornam- se um trabalho custoso e, às vezes, impraticáveis. Sendo assim, o presente trabalho propõe o desenvolvimento de uma ferramenta que extraia o esquema de uma coleção de documentos no formato JSON, armazenados em um banco de dados NoSQL orientado a documentos, com o objetivo de facilitar diversas tarefas de manipulação posterior desses dados, como a recuperação, validação, integração e análise de dados. Na fase de extração das estruturas dos documentos são aplicadas operações de agregação visando obter um documento para cada estrutura distinta e também é proposta uma estrutura global para agrupar essas estruturas a fim de gerar um único esquema no formato JSON Schema. Finalmente, experimentos realizados em datasets reais do DBPedia, Foursquare e GitHub, além de um dataset hipotético, demonstram que os resultados de tempo de processamento e a completude dos esquemas gerados são comparáveis com os resultados encontrados em abordagens do estado da arte.NoSQL databases are becoming increasingly popular in application development, among other features, because of their ability to handle large data volumes and also their ability to be schemaless. Although most NoSQL databases are schemaless, information about the structural properties of stored data is essential during the application development. Without the knowledge of these structural properties, application development or data analysis activities become costly and sometimes unfeasible. Thus, this work proposes a tool that, given a collection of data in JSON format, stored in a document-oriented NoSQL database, performs the extraction of its schema, with the purpose of facilitating further data manipulation tasks, like data retrieval, integration, validation and analysis. In the extraction phase of the document structure, aggregation operations are applied to obtain a document for each distinct structure. Besides, a global structure is proposed to group these structures in order to present a single schema in JSON Schema format. Finally, experiments based on real DBPedia, Foursquare and GitHub datasets, as well as a hypothetical dataset, demonstrate that the results of processing time and completeness of the schemes generated are comparable with the results found in state of the art approaches.Florianópolis, SCMello, Ronaldo dos SantosFrozza, Angelo AugustoUniversidade Federal de Santa CatarinaCosta, Felipe de Souza da2017-12-13T21:06:11Z2017-12-13T21:06:11Z2017-11-21info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesis274 f.application/pdfhttps://repositorio.ufsc.br/xmlui/handle/123456789/182209porreponame:Repositório Institucional da UFSCinstname:Universidade Federal de Santa Catarina (UFSC)instacron:UFSCinfo:eu-repo/semantics/openAccess2017-12-13T21:06:11Zoai:repositorio.ufsc.br:123456789/182209Repositório InstitucionalPUBhttp://150.162.242.35/oai/requestopendoar:23732017-12-13T21:06:11Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)false |
dc.title.none.fl_str_mv |
Uma Ferramenta para Extração de Esquemas de Bancos de Dados NoSQL Orientados a Documentos |
title |
Uma Ferramenta para Extração de Esquemas de Bancos de Dados NoSQL Orientados a Documentos |
spellingShingle |
Uma Ferramenta para Extração de Esquemas de Bancos de Dados NoSQL Orientados a Documentos Costa, Felipe de Souza da Extração de esquemas NoSQL Banco de Dados orientado a documentos JSON JSON Schema |
title_short |
Uma Ferramenta para Extração de Esquemas de Bancos de Dados NoSQL Orientados a Documentos |
title_full |
Uma Ferramenta para Extração de Esquemas de Bancos de Dados NoSQL Orientados a Documentos |
title_fullStr |
Uma Ferramenta para Extração de Esquemas de Bancos de Dados NoSQL Orientados a Documentos |
title_full_unstemmed |
Uma Ferramenta para Extração de Esquemas de Bancos de Dados NoSQL Orientados a Documentos |
title_sort |
Uma Ferramenta para Extração de Esquemas de Bancos de Dados NoSQL Orientados a Documentos |
author |
Costa, Felipe de Souza da |
author_facet |
Costa, Felipe de Souza da |
author_role |
author |
dc.contributor.none.fl_str_mv |
Mello, Ronaldo dos Santos Frozza, Angelo Augusto Universidade Federal de Santa Catarina |
dc.contributor.author.fl_str_mv |
Costa, Felipe de Souza da |
dc.subject.por.fl_str_mv |
Extração de esquemas NoSQL Banco de Dados orientado a documentos JSON JSON Schema |
topic |
Extração de esquemas NoSQL Banco de Dados orientado a documentos JSON JSON Schema |
description |
TCC(graduação) - Universidade Federal de Santa Catarina. Centro Tecnológico. Sistemas de Informação. |
publishDate |
2017 |
dc.date.none.fl_str_mv |
2017-12-13T21:06:11Z 2017-12-13T21:06:11Z 2017-11-21 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufsc.br/xmlui/handle/123456789/182209 |
url |
https://repositorio.ufsc.br/xmlui/handle/123456789/182209 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
274 f. application/pdf |
dc.publisher.none.fl_str_mv |
Florianópolis, SC |
publisher.none.fl_str_mv |
Florianópolis, SC |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFSC instname:Universidade Federal de Santa Catarina (UFSC) instacron:UFSC |
instname_str |
Universidade Federal de Santa Catarina (UFSC) |
instacron_str |
UFSC |
institution |
UFSC |
reponame_str |
Repositório Institucional da UFSC |
collection |
Repositório Institucional da UFSC |
repository.name.fl_str_mv |
Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC) |
repository.mail.fl_str_mv |
|
_version_ |
1808651912466137088 |