Proveniência de dados de workflows de bioinformática usando o banco de dados no SQL ArangoDB

Detalhes bibliográficos
Autor(a) principal: Sousa, Bruno Aires de
Data de Publicação: 2015
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Biblioteca Digital de Monografias da UnB
Texto Completo: http://bdm.unb.br/handle/10483/14116
Resumo: Monografia (graduação)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2015.
id UNB-2_42bd395dce6631bd20b17c0fa937fb8c
oai_identifier_str oai:bdm.unb.br:10483/14116
network_acronym_str UNB-2
network_name_str Biblioteca Digital de Monografias da UnB
repository_id_str 11571
spelling Sousa, Bruno Aires deHolanda, Maristela Terto deSOUSA, Bruno Aires de. Proveniência de dados de workflows de bioinformática usando o banco de dados no SQL ArangoDB. 2015. xi, 49 f., il. Monografia (Bacharelado em Engenharia da Computação)—Universidade de Brasília, Brasília, 2015.http://bdm.unb.br/handle/10483/14116Monografia (graduação)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2015.Este trabalho apresenta uma análise da utilização do sistema gerenciador de banco de dados NoSQL ArangoDB em workflow de Bioinformática. O ArangoDB é um banco híbrido que possui um modelo baseado em grafo e em documento para persistência de dados. Para isso, foi realizado um estudo sobre o armazenamento de dados gerados na fases de filtragem e de mapeamento de um workflow de Bioinformática, bem como a geração de grafos de proveniência a partir dos processos utilizados. O estudo foi motivado pela possibilidade de se armazenar os dados gerados ao longo do processamento do workflow e informações sobre sua execução em um mesmo lugar, o que facilitaria a reexecução de um workflow científico, visto que não seria necessário buscar novamente os dados que foram utilizados em um dado experimento. Como resultado, este trabalho demonstra como os dados gerados pelo workflow e seus dados de proveniência foram armazenados no ArangoDB utilizando o modelo PROV-DM.Submitted by Nayara Silva (nayarasilva@bce.unb.br) on 2016-05-20T17:42:51Z No. of bitstreams: 1 2015_BrunoAiresdeSousa.pdf: 1081423 bytes, checksum: 35cda69c218fee69e81c4ef6b5c03822 (MD5)Approved for entry into archive by Luanna Maia (luanna@bce.unb.br) on 2016-08-15T14:02:26Z (GMT) No. of bitstreams: 3 2015_BrunoAiresdeSousa.pdf: 1081423 bytes, checksum: 35cda69c218fee69e81c4ef6b5c03822 (MD5) license_text: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) license_rdf: 23148 bytes, checksum: 9da0b6dfac957114c6a7714714b86306 (MD5)Made available in DSpace on 2016-08-15T14:02:26Z (GMT). No. of bitstreams: 3 2015_BrunoAiresdeSousa.pdf: 1081423 bytes, checksum: 35cda69c218fee69e81c4ef6b5c03822 (MD5) license_text: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) license_rdf: 23148 bytes, checksum: 9da0b6dfac957114c6a7714714b86306 (MD5)This work presents a study about the use of the database management system NoSQL ArangoDB in Bioinformatics workflow. The ArangoDB is a database that has a hybrid model based on graph and document for data persistence. It was studied the storing of data of the filtering and mapping stages from a Bioinformatics workflow, as well the provenance graph generated by the used process. The study was motivated by the possibility of storing data generated during the processing of the workflow and data about its execution in one place, which would facilitate the re-execution of a scientific workflow, because it would not be necessary to look again the data that were used in a given experiment. As a result, this work demonstrates how the data generated by workflow and its provenance were stored on ArangoDB using the PROV-DM model.Proveniência de dados de workflows de bioinformática usando o banco de dados no SQL ArangoDBinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesis2016-08-15T14:02:26Z2016-08-15T14:02:26Z2015-12-15NoSQL (Banco de dados)Banco de dadosBioinformáticainfo:eu-repo/semantics/openAccessporreponame:Biblioteca Digital de Monografias da UnBinstname:Universidade de Brasília (UnB)instacron:UNBORIGINAL2015_BrunoAiresdeSousa.pdf2015_BrunoAiresdeSousa.pdfapplication/pdf1081423http://bdm.unb.br/xmlui/bitstream/10483/14116/1/2015_BrunoAiresdeSousa.pdf35cda69c218fee69e81c4ef6b5c03822MD51CC-LICENSElicense_urllicense_urltext/plain49http://bdm.unb.br/xmlui/bitstream/10483/14116/2/license_url4afdbb8c545fd630ea7db775da747b2fMD52license_textlicense_textapplication/octet-stream0http://bdm.unb.br/xmlui/bitstream/10483/14116/3/license_textd41d8cd98f00b204e9800998ecf8427eMD53license_rdflicense_rdfapplication/octet-stream23148http://bdm.unb.br/xmlui/bitstream/10483/14116/4/license_rdf9da0b6dfac957114c6a7714714b86306MD54LICENSElicense.txtlicense.txttext/plain1847http://bdm.unb.br/xmlui/bitstream/10483/14116/5/license.txt85117888ea11b2ebc893b55387113648MD5510483/141162016-08-15 11:05:05.875oai:bdm.unb.br:10483/14116TGljZW5zZSBncmFudGVkIGJ5IE5heWFyYSBTaWx2YSAobmF5YXJhc2lsdmFAYmNlLnVuYi5icikgb24gMjAxNi0wNS0yMFQxNzo0Mjo1MVogKEdNVCk6CgrDiSBuZWNlc3PDoXJpbyBjb25jb3JkYXIgY29tIGEgbGljZW7Dp2EgZGUgZGlzdHJpYnVpw6fDo28gbsOjby1leGNsdXNpdmEsCmFudGVzIHF1ZSBvIGRvY3VtZW50byBwb3NzYSBhcGFyZWNlciBubyBSZXBvc2l0w7NyaW8uIFBvciBmYXZvciwgbGVpYSBhCmxpY2Vuw6dhIGF0ZW50YW1lbnRlLiBDYXNvIG5lY2Vzc2l0ZSBkZSBhbGd1bSBlc2NsYXJlY2ltZW50byBlbnRyZSBlbQpjb250YXRvIGF0cmF2w6lzIGRlOiBiZG1AYmNlLnVuYi5iciBvdSAzMTA3LTI2ODcuCgpMSUNFTsOHQSBERSBESVNUUklCVUnDh8ODTyBOw4NPLUVYQ0xVU0lWQQoKQW8gYXNzaW5hciBlIGVudHJlZ2FyIGVzdGEgbGljZW7Dp2EsIG8vYSBTci4vU3JhLiAoYXV0b3Igb3UgZGV0ZW50b3IgZG9zCmRpcmVpdG9zIGRlIGF1dG9yKToKCmEpIENvbmNlZGUgw6AgVW5pdmVyc2lkYWRlIGRlIEJyYXPDrWxpYSBvIGRpcmVpdG8gbsOjby1leGNsdXNpdm8gZGUKcmVwcm9kdXppciwgY29udmVydGVyIChjb21vIGRlZmluaWRvIGFiYWl4byksIGNvbXVuaWNhciBlL291CmRpc3RyaWJ1aXIgbyBkb2N1bWVudG8gZW50cmVndWUgKGluY2x1aW5kbyBvIHJlc3Vtby9hYnN0cmFjdCkgZW0KZm9ybWF0byBkaWdpdGFsIG91IGltcHJlc3NvIGUgZW0gcXVhbHF1ZXIgbWVpby4KCmIpIERlY2xhcmEgcXVlIG8gZG9jdW1lbnRvIGVudHJlZ3VlIMOpIHNldSB0cmFiYWxobyBvcmlnaW5hbCwgZSBxdWUKZGV0w6ltIG8gZGlyZWl0byBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4gRGVjbGFyYQp0YW1iw6ltIHF1ZSBhIGVudHJlZ2EgZG8gZG9jdW1lbnRvIG7Do28gaW5mcmluZ2UsIHRhbnRvIHF1YW50byBsaGUgw6kKcG9zc8OtdmVsIHNhYmVyLCBvcyBkaXJlaXRvcyBkZSBxdWFscXVlciBvdXRyYSBwZXNzb2Egb3UgZW50aWRhZGUuCgpjKSBTZSBvIGRvY3VtZW50byBlbnRyZWd1ZSBjb250w6ltIG1hdGVyaWFsIGRvIHF1YWwgbsOjbyBkZXTDqW0gb3MKZGlyZWl0b3MgZGUgYXV0b3IsIGRlY2xhcmEgcXVlIG9idGV2ZSBhdXRvcml6YcOnw6NvIGRvIGRldGVudG9yIGRvcwpkaXJlaXRvcyBkZSBhdXRvciBwYXJhIGNvbmNlZGVyIMOgIFVuaXZlcnNpZGFkZSBkZSBCcmFzw61saWEgb3MgZGlyZWl0b3MKcmVxdWVyaWRvcyBwb3IgZXN0YSBsaWNlbsOnYSwgZSBxdWUgZXNzZSBtYXRlcmlhbCBjdWpvcyBkaXJlaXRvcyBzw6NvIGRlCnRlcmNlaXJvcyBlc3TDoSBjbGFyYW1lbnRlIGlkZW50aWZpY2FkbyBlIHJlY29uaGVjaWRvIG5vIHRleHRvIG91CmNvbnRlw7pkbyBkbyBkb2N1bWVudG8gZW50cmVndWUuCgpTZSBvIGRvY3VtZW50byBlbnRyZWd1ZSDDqSBiYXNlYWRvIGVtIHRyYWJhbGhvIGZpbmFuY2lhZG8gb3UgYXBvaWFkbwpwb3Igb3V0cmEgaW5zdGl0dWnDp8OjbyBxdWUgbsOjbyBhIFVuaXZlcnNpZGFkZSBkZSBCcmFzw61saWEsIGRlY2xhcmEgcXVlCmN1bXByaXUgcXVhaXNxdWVyIG9icmlnYcOnw7VlcyBleGlnaWRhcyBwZWxvIHJlc3BlY3Rpdm8gY29udHJhdG8gb3UKYWNvcmRvLgoKQSBVbml2ZXJzaWRhZGUgZGUgQnJhc8OtbGlhIGlkZW50aWZpY2Fyw6EgY2xhcmFtZW50ZSBvKHMpIHNldSAocykgbm9tZSAocykKY29tbyBvIChzKSBhdXRvciAoZXMpIG91IGRldGVudG9yIChlcykgZG9zIGRpcmVpdG9zIGRvIGRvY3VtZW50bwplbnRyZWd1ZSwgZSBuw6NvIGZhcsOhIHF1YWxxdWVyIGFsdGVyYcOnw6NvLCBwYXJhIGFsw6ltIGRhcyBwZXJtaXRpZGFzIHBvcgplc3RhIGxpY2Vuw6dhLgo=Biblioteca Digital de Monografiahttps://bdm.unb.br/PUBhttp://bdm.unb.br/oai/requestbdm@bce.unb.br||patricia@bce.unb.bropendoar:115712016-08-15T14:05:05Biblioteca Digital de Monografias da UnB - Universidade de Brasília (UnB)false
dc.title.pt_BR.fl_str_mv Proveniência de dados de workflows de bioinformática usando o banco de dados no SQL ArangoDB
title Proveniência de dados de workflows de bioinformática usando o banco de dados no SQL ArangoDB
spellingShingle Proveniência de dados de workflows de bioinformática usando o banco de dados no SQL ArangoDB
Sousa, Bruno Aires de
NoSQL (Banco de dados)
Banco de dados
Bioinformática
title_short Proveniência de dados de workflows de bioinformática usando o banco de dados no SQL ArangoDB
title_full Proveniência de dados de workflows de bioinformática usando o banco de dados no SQL ArangoDB
title_fullStr Proveniência de dados de workflows de bioinformática usando o banco de dados no SQL ArangoDB
title_full_unstemmed Proveniência de dados de workflows de bioinformática usando o banco de dados no SQL ArangoDB
title_sort Proveniência de dados de workflows de bioinformática usando o banco de dados no SQL ArangoDB
author Sousa, Bruno Aires de
author_facet Sousa, Bruno Aires de
author_role author
dc.contributor.author.fl_str_mv Sousa, Bruno Aires de
dc.contributor.advisor1.fl_str_mv Holanda, Maristela Terto de
contributor_str_mv Holanda, Maristela Terto de
dc.subject.por.fl_str_mv NoSQL (Banco de dados)
Banco de dados
Bioinformática
topic NoSQL (Banco de dados)
Banco de dados
Bioinformática
description Monografia (graduação)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2015.
publishDate 2015
dc.date.submitted.none.fl_str_mv 2015-12-15
dc.date.accessioned.fl_str_mv 2016-08-15T14:02:26Z
dc.date.available.fl_str_mv 2016-08-15T14:02:26Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv SOUSA, Bruno Aires de. Proveniência de dados de workflows de bioinformática usando o banco de dados no SQL ArangoDB. 2015. xi, 49 f., il. Monografia (Bacharelado em Engenharia da Computação)—Universidade de Brasília, Brasília, 2015.
dc.identifier.uri.fl_str_mv http://bdm.unb.br/handle/10483/14116
identifier_str_mv SOUSA, Bruno Aires de. Proveniência de dados de workflows de bioinformática usando o banco de dados no SQL ArangoDB. 2015. xi, 49 f., il. Monografia (Bacharelado em Engenharia da Computação)—Universidade de Brasília, Brasília, 2015.
url http://bdm.unb.br/handle/10483/14116
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Monografias da UnB
instname:Universidade de Brasília (UnB)
instacron:UNB
instname_str Universidade de Brasília (UnB)
instacron_str UNB
institution UNB
reponame_str Biblioteca Digital de Monografias da UnB
collection Biblioteca Digital de Monografias da UnB
bitstream.url.fl_str_mv http://bdm.unb.br/xmlui/bitstream/10483/14116/1/2015_BrunoAiresdeSousa.pdf
http://bdm.unb.br/xmlui/bitstream/10483/14116/2/license_url
http://bdm.unb.br/xmlui/bitstream/10483/14116/3/license_text
http://bdm.unb.br/xmlui/bitstream/10483/14116/4/license_rdf
http://bdm.unb.br/xmlui/bitstream/10483/14116/5/license.txt
bitstream.checksum.fl_str_mv 35cda69c218fee69e81c4ef6b5c03822
4afdbb8c545fd630ea7db775da747b2f
d41d8cd98f00b204e9800998ecf8427e
9da0b6dfac957114c6a7714714b86306
85117888ea11b2ebc893b55387113648
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Monografias da UnB - Universidade de Brasília (UnB)
repository.mail.fl_str_mv bdm@bce.unb.br||patricia@bce.unb.br
_version_ 1813907878001508352