Gerenciamento de proveniência de dados de workflows de bioinformática em ambiente de nuvens federadas

Detalhes bibliográficos
Autor(a) principal: Oliveira, Polyane Wercelens de
Data de Publicação: 2019
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UnB
Texto Completo: https://repositorio.unb.br/handle/10482/37275
Resumo: Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2019.
id UNB_eedf3909acbad98bf47bba6b8646b096
oai_identifier_str oai:repositorio2.unb.br:10482/37275
network_acronym_str UNB
network_name_str Repositório Institucional da UnB
repository_id_str
spelling Oliveira, Polyane Wercelens deAraújo, Aletéia Patrícia Favacho deHolanda, Maristela Terto de2020-04-01T12:15:01Z2020-04-01T12:15:01Z2020-04-012019-07-03OLIVEIRA, Polyane Wercelens de. Gerenciamento de proveniência de dados de workflows de bioinformática em ambiente de nuvens federadas. 2019. 84 f., il. Dissertação (Mestrado em Informática)—Universidade de Brasília, Brasília, 2019.https://repositorio.unb.br/handle/10482/37275Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2019.Workflows de Bioinformática prioritariamente visam tratar, processar e analisar dados oriundos de sequenciamento de DNA/RNA. A diversidade desses workflows é dependente da questão biológica que se pretende responder, e por isso podem ser bastante com- plexos. O uso de nuvem federada em workflows de Bioinformática, ao mesmo tempo que oferece flexibilidade para o usuário, pode aumentar o trabalho de configuração do ambiente quando comparado a um ambiente de nuvem computacional. Independentemente da questão biológica, e considerando o ambiente computacional como parte do experimento in silico, a documentação do workflow tem particularidades a serem preservadas com vistas à sua reprodutibilidade. Os modelos de proveniência de dados proveem uma estrutura de armazenamento e recuperação dos dados de proveniência, mantendo seus significados. A maneira com a qual os dados de proveniência são armazenados é outra característica, cujos aspectos tecnológicos influenciam o resultado final. Neste contexto, este trabalho propõe uma solução que permita o gerenciamento de dados de proveniência de workflows de Bioinformática em um ambiente de nuvem federada, armazenando os dados de proveniência de forma distribuída em esquemas de dados baseados no PROV- DM, utilizando sistemas de banco de dados NoSQL. Nos resultados, foram explorados aspectos relacionados à federação de nuvens, o que proporcionou menos dependência de um único provedor para os serviços hospedados. Em relação às bases de dados, este trabalho traz três opções de tecnologias de banco de dados para armazenar a proveniência de dados usando o modelo de dados PROV-DM, incluindo o esquema de dados específico de cada banco de dados, que pode ser usado de acordo com a preferência do pesquisador ou integrado aos sistemas de gerenciamento de workflows. Por fim, a solução proposta demonstrou ser adequada para o gerenciamento dos dados de proveniência para workflows de Bioinformática em nuvem federada.Bioinformatics workflows essentially aim to treat, process, and analyze data from DNA or RNA sequencing. The diversity of these workflows is dependent on the biological question to be answered, which therefore can be quite complex. The computational environment is part of the in silico experiment, and regardless of biological questions, the workflow’s documentation has particularities to be preserved to promote its reproducibility. Data provenance models address this problem providing a storage and query structure of data provenance while maintaining their meanings. Moreover, technological aspects can influence how data provenance is stored. Using federated cloud in Bioinformatics workflows can provide both flexibility for the user and increase the environment configuring work compared to a cloud computing environment. In this context, this work proposes a solution to data provenance management for Bioinformatics workflows using NoSQL database systems in a federated cloud environment, storing data provenance in distributed databases using data schemas based on PROV-DM. The results report aspects related to cloud federation providing less dependence on a single provider for the hosted services. Concerning the databases, this work draws three options of database technolo- gies to store data provenance using the PROV-DM data model. Specific database data schemas are provided and can be used according to the researcher’s preference and can be integrated into workflow management systems. Finally, it is proposed a suitable solution for the data provenance management for Bioinformatics workflows in a federated cloud.A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.bce.unb.br, www.ibict.br, http://hercules.vtls.com/cgi-bin/ndltd/chameleon?lng=pt&skin=ndltd sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data.info:eu-repo/semantics/openAccessGerenciamento de proveniência de dados de workflows de bioinformática em ambiente de nuvens federadasinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisBioinformáticaBanco de dadosNoSQL (Not Only SQL)Nuvens federadasNuvens computacionaisporreponame:Repositório Institucional da UnBinstname:Universidade de Brasília (UnB)instacron:UNBORIGINAL2019_PolyaneWercelensdeOliveira.pdf2019_PolyaneWercelensdeOliveira.pdfapplication/pdf2527032http://repositorio2.unb.br/jspui/bitstream/10482/37275/1/2019_PolyaneWercelensdeOliveira.pdfe257a6af825eacef8716327857860f7eMD51open accessLICENSElicense.txtlicense.txttext/plain671http://repositorio2.unb.br/jspui/bitstream/10482/37275/2/license.txtbacfee268cc5d4f6aaa2e6e0066d38f5MD52open access10482/372752023-07-14 15:56:23.04open accessoai:repositorio2.unb.br:10482/37275QSBjb25jZXNzw6NvIGRhIGxpY2Vuw6dhIGRlc3RlIGl0ZW0gcmVmZXJlLXNlIGFvIHRlcm1vIGRlIGF1dG9yaXphw6fDo28gaW1wcmVzc28gYXNzaW5hZG8gDQpwZWxvIGF1dG9yIGNvbSBhcyBzZWd1aW50ZXMgY29uZGnDp8O1ZXM6DQoNCk5hIHF1YWxpZGFkZSBkZSB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvciBkYSBwdWJsaWNhw6fDo28sIGF1dG9yaXpvIGEgVW5pdmVyc2lkYWRlIGRlIEJyYXPDrWxpYQ0KIGUgbyBJQklDVCBhIGRpc3BvbmliaWxpemFyIHBvciBtZWlvIGRvcyBzaXRlcyB3d3cuYmNlLnVuYi5iciwgd3d3LmliaWN0LmJyLA0KIGh0dHA6Ly9oZXJjdWxlcy52dGxzLmNvbS9jZ2ktYmluL25kbHRkL2NoYW1lbGVvbj9sbmc9cHQmc2tpbj1uZGx0ZCBzZW0gcmVzc2FyY2ltZW50byBkb3MgDQpkaXJlaXRvcyBhdXRvcmFpcywgZGUgYWNvcmRvIGNvbSBhIExlaSBuwrogOTYxMC85OCwgbyB0ZXh0byBpbnRlZ3JhbCBkYSBvYnJhIGRpc3BvbmliaWxpemFkYSwNCiBjb25mb3JtZSBwZXJtaXNzw7VlcyBhc3NpbmFsYWRhcywgcGFyYSBmaW5zIGRlIGxlaXR1cmEsIGltcHJlc3PDo28gZS9vdSBkb3dubG9hZCwgYSB0w610dWxvIGRlIA0KZGl2dWxnYcOnw6NvIGRhIHByb2R1w6fDo28gY2llbnTDrWZpY2EgYnJhc2lsZWlyYSwgYSBwYXJ0aXIgZGVzdGEgZGF0YS4=Biblioteca Digital de Teses e DissertaçõesPUBhttps://repositorio.unb.br/oai/requestopendoar:2023-07-14T18:56:23Repositório Institucional da UnB - Universidade de Brasília (UnB)false
dc.title.pt_BR.fl_str_mv Gerenciamento de proveniência de dados de workflows de bioinformática em ambiente de nuvens federadas
title Gerenciamento de proveniência de dados de workflows de bioinformática em ambiente de nuvens federadas
spellingShingle Gerenciamento de proveniência de dados de workflows de bioinformática em ambiente de nuvens federadas
Oliveira, Polyane Wercelens de
Bioinformática
Banco de dados
NoSQL (Not Only SQL)
Nuvens federadas
Nuvens computacionais
title_short Gerenciamento de proveniência de dados de workflows de bioinformática em ambiente de nuvens federadas
title_full Gerenciamento de proveniência de dados de workflows de bioinformática em ambiente de nuvens federadas
title_fullStr Gerenciamento de proveniência de dados de workflows de bioinformática em ambiente de nuvens federadas
title_full_unstemmed Gerenciamento de proveniência de dados de workflows de bioinformática em ambiente de nuvens federadas
title_sort Gerenciamento de proveniência de dados de workflows de bioinformática em ambiente de nuvens federadas
author Oliveira, Polyane Wercelens de
author_facet Oliveira, Polyane Wercelens de
author_role author
dc.contributor.advisorco.none.fl_str_mv Araújo, Aletéia Patrícia Favacho de
dc.contributor.author.fl_str_mv Oliveira, Polyane Wercelens de
dc.contributor.advisor1.fl_str_mv Holanda, Maristela Terto de
contributor_str_mv Holanda, Maristela Terto de
dc.subject.keyword.pt_BR.fl_str_mv Bioinformática
Banco de dados
NoSQL (Not Only SQL)
Nuvens federadas
Nuvens computacionais
topic Bioinformática
Banco de dados
NoSQL (Not Only SQL)
Nuvens federadas
Nuvens computacionais
description Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2019.
publishDate 2019
dc.date.submitted.none.fl_str_mv 2019-07-03
dc.date.accessioned.fl_str_mv 2020-04-01T12:15:01Z
dc.date.available.fl_str_mv 2020-04-01T12:15:01Z
dc.date.issued.fl_str_mv 2020-04-01
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv OLIVEIRA, Polyane Wercelens de. Gerenciamento de proveniência de dados de workflows de bioinformática em ambiente de nuvens federadas. 2019. 84 f., il. Dissertação (Mestrado em Informática)—Universidade de Brasília, Brasília, 2019.
dc.identifier.uri.fl_str_mv https://repositorio.unb.br/handle/10482/37275
identifier_str_mv OLIVEIRA, Polyane Wercelens de. Gerenciamento de proveniência de dados de workflows de bioinformática em ambiente de nuvens federadas. 2019. 84 f., il. Dissertação (Mestrado em Informática)—Universidade de Brasília, Brasília, 2019.
url https://repositorio.unb.br/handle/10482/37275
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.source.none.fl_str_mv reponame:Repositório Institucional da UnB
instname:Universidade de Brasília (UnB)
instacron:UNB
instname_str Universidade de Brasília (UnB)
instacron_str UNB
institution UNB
reponame_str Repositório Institucional da UnB
collection Repositório Institucional da UnB
bitstream.url.fl_str_mv http://repositorio2.unb.br/jspui/bitstream/10482/37275/1/2019_PolyaneWercelensdeOliveira.pdf
http://repositorio2.unb.br/jspui/bitstream/10482/37275/2/license.txt
bitstream.checksum.fl_str_mv e257a6af825eacef8716327857860f7e
bacfee268cc5d4f6aaa2e6e0066d38f5
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UnB - Universidade de Brasília (UnB)
repository.mail.fl_str_mv
_version_ 1801864074097590272