Política de armazenamento de dados em nuvens federadas para dados biológicos

Detalhes bibliográficos
Autor(a) principal: Gallon, Ricardo Fernandes
Data de Publicação: 2014
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UnB
Texto Completo: http://repositorio.unb.br/handle/10482/17003
Resumo: Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2014.
id UNB_eab026f5d41db4f9dd571cfd7550a218
oai_identifier_str oai:repositorio2.unb.br:10482/17003
network_acronym_str UNB
network_name_str Repositório Institucional da UnB
repository_id_str
spelling Gallon, Ricardo FernandesAraújo, Aletéia Patrícia Favacho deHolanda, Maristela Terto de2014-11-24T15:14:24Z2014-11-24T15:14:24Z2014-11-242014-07-07GALLON, Ricardo Fernandes. Política de armazenamento de dados em nuvens federadas para dados biológicos. 2014. viii, 58 f., il. Dissertação (Mestrado em Informática)—Universidade de Brasília, Brasília, 2014.http://repositorio.unb.br/handle/10482/17003Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2014.A computação em nuvem tem possibilitado a integração de diversos provedores para a execução de tarefas de forma mais rápida em comparação a utilização dos modelos anteriores,e uma visão ao usuário de que os recursos de armazenamento e processamento são ilimitados. A Bioinformática, que lida com grande volume de informações, pode utilizar-se da infraestrutura de computação em nuvem para disponibilizar suas ferramentas,para serem utilizadas nos fluxos de trabalhos, chamados workflows. Além disso, as instituições podem associar-se a outras instituições para formar uma federação de nuvens computacionais, proporcionando maior flexibilidade na escolha de provedores de serviço.Neste contexto, o desempenho da execução de workflows de Bioinformática é fortemente afetado pelo armazenamento e recuperação de dados, devido ao grande volume de informações das sequências genômicas. Desta forma, a escolha da melhor nuvem para estas operações é fundamental para a eficiência da execução do workflow. O presente trabalho tem por objetivo propor uma política de armazenamento de dados genômicos para nuvens computacionais federadas buscando, através da definição de alguns critérios de seleção e estratégias, diminuir o tempo de transferência dos dados e assim contribuir para a diminuição do tempo total de execução do workflow. Foi realizado um estudo de caso, com dados reais, utilizando a plataforma BioNimbuZ[1], que é uma arquitetura para execução de workflows de bioinformática no ambiente de nuvens federadas. Com os resultados obtidos, foi possível determinar o peso de cada critério da política de armazenamento e realizar as análises em relação a política originalmente criada para a arquitetura. Desta forma, a política de armazenamento proposta apresentou ganhos quanto a eficiência, principalmente em nuvens com grande poder computacional. ________________________________________________________________________________ ABSTRACTCloud computing has enabled the integration of providers to perform tasks faster, and has allowed users to view the processing and storage resources as unlimited. Bio informatics, which handles large volume of information produced by high-throughput sequencing machines, may use the infrastructure of cloud computing to provide tools to be used in workflows. In addition, institutions may join other institutions to form a federation of computing clouds, providing greater flexibility in the choice of service providers. In this context, the performance of the implementation of a workflow is strongly affected by the storage and retrieval of data, due to the large amount of information from genomic sequences. Thus, choosing the best cloud for these operations is critical to the efficiency of the workflow. This work aims to propose a policy for the storage of genomic data for federated cloud computing seeking, by defining some selection criteria and strategies, toreduce the time of data transfer and thus contribute to the reduction of total execution time of the workflow. A case study was carried out with real data, using BioNimbuZ platform, which is an architecture for the implementation of bioinformatics workflows infederated cloud environments. With the results obtained, it was possible to determine the weight of each storage policy criteria and perform the analysis regarding the policy originally created for the architecture. Thus, the storage policy proposal presented efficiency gains, especially in clouds with great computing power.A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.bce.unb.br, www.ibict.br, http://hercules.vtls.com/cgi-bin/ndltd/chameleon?lng=pt&skin=ndltd sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data.info:eu-repo/semantics/openAccessPolítica de armazenamento de dados em nuvens federadas para dados biológicosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisComputação em nuvemBanco de dadosporreponame:Repositório Institucional da UnBinstname:Universidade de Brasília (UnB)instacron:UNBORIGINAL2014_RicardoFernandesGallon.pdf2014_RicardoFernandesGallon.pdfapplication/pdf1641798http://repositorio2.unb.br/jspui/bitstream/10482/17003/1/2014_RicardoFernandesGallon.pdf0acfed544c445d0bab511a4a677e857cMD51open accessLICENSElicense.txtlicense.txttext/plain774http://repositorio2.unb.br/jspui/bitstream/10482/17003/2/license.txt0be21ba28de595607fe3af59b285ff0aMD52open access10482/170032023-07-14 15:56:24.27open accessoai:repositorio2.unb.br:10482/17003TGljZW5zZSBncmFudGVkIGJ5IEFuYSBDcmlzdGluYSBCYXJib3NhIGRhIFNpbHZhIChhbm5hYmRzQGhvdG1haWwuY29tKSBvbiAyMDE0LTExLTIwVDE2OjM5OjAzWiAoR01UKToKCkEgY29uY2Vzc8OjbyBkYSBsaWNlbsOnYSBkZXN0ZSBpdGVtIHJlZmVyZS1zZSBhbyB0ZXJtbyBkZSBhdXRvcml6YcOnw6NvIGltcHJlc3NvIGFzc2luYWRvIA0KcGVsbyBhdXRvciBjb20gYXMgc2VndWludGVzIGNvbmRpw6fDtWVzOg0KDQpOYSBxdWFsaWRhZGUgZGUgdGl0dWxhciBkb3MgZGlyZWl0b3MgZGUgYXV0b3IgZGEgcHVibGljYcOnw6NvLCBhdXRvcml6byBhIFVuaXZlcnNpZGFkZSBkZSBCcmFzw61saWENCiBlIG8gSUJJQ1QgYSBkaXNwb25pYmlsaXphciBwb3IgbWVpbyBkb3Mgc2l0ZXMgd3d3LmJjZS51bmIuYnIsIHd3dy5pYmljdC5iciwNCiBodHRwOi8vaGVyY3VsZXMudnRscy5jb20vY2dpLWJpbi9uZGx0ZC9jaGFtZWxlb24/bG5nPXB0JnNraW49bmRsdGQgc2VtIHJlc3NhcmNpbWVudG8gZG9zIA0KZGlyZWl0b3MgYXV0b3JhaXMsIGRlIGFjb3JkbyBjb20gYSBMZWkgbsK6IDk2MTAvOTgsIG8gdGV4dG8gaW50ZWdyYWwgZGEgb2JyYSBkaXNwb25pYmlsaXphZGEsDQogY29uZm9ybWUgcGVybWlzc8O1ZXMgYXNzaW5hbGFkYXMsIHBhcmEgZmlucyBkZSBsZWl0dXJhLCBpbXByZXNzw6NvIGUvb3UgZG93bmxvYWQsIGEgdMOtdHVsbyBkZSANCmRpdnVsZ2HDp8OjbyBkYSBwcm9kdcOnw6NvIGNpZW50w61maWNhIGJyYXNpbGVpcmEsIGEgcGFydGlyIGRlc3RhIGRhdGEuBiblioteca Digital de Teses e DissertaçõesPUBhttps://repositorio.unb.br/oai/requestopendoar:2023-07-14T18:56:24Repositório Institucional da UnB - Universidade de Brasília (UnB)false
dc.title.en.fl_str_mv Política de armazenamento de dados em nuvens federadas para dados biológicos
title Política de armazenamento de dados em nuvens federadas para dados biológicos
spellingShingle Política de armazenamento de dados em nuvens federadas para dados biológicos
Gallon, Ricardo Fernandes
Computação em nuvem
Banco de dados
title_short Política de armazenamento de dados em nuvens federadas para dados biológicos
title_full Política de armazenamento de dados em nuvens federadas para dados biológicos
title_fullStr Política de armazenamento de dados em nuvens federadas para dados biológicos
title_full_unstemmed Política de armazenamento de dados em nuvens federadas para dados biológicos
title_sort Política de armazenamento de dados em nuvens federadas para dados biológicos
author Gallon, Ricardo Fernandes
author_facet Gallon, Ricardo Fernandes
author_role author
dc.contributor.advisorco.none.fl_str_mv Araújo, Aletéia Patrícia Favacho de
dc.contributor.author.fl_str_mv Gallon, Ricardo Fernandes
dc.contributor.advisor1.fl_str_mv Holanda, Maristela Terto de
contributor_str_mv Holanda, Maristela Terto de
dc.subject.keyword.en.fl_str_mv Computação em nuvem
Banco de dados
topic Computação em nuvem
Banco de dados
description Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2014.
publishDate 2014
dc.date.submitted.none.fl_str_mv 2014-07-07
dc.date.accessioned.fl_str_mv 2014-11-24T15:14:24Z
dc.date.available.fl_str_mv 2014-11-24T15:14:24Z
dc.date.issued.fl_str_mv 2014-11-24
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv GALLON, Ricardo Fernandes. Política de armazenamento de dados em nuvens federadas para dados biológicos. 2014. viii, 58 f., il. Dissertação (Mestrado em Informática)—Universidade de Brasília, Brasília, 2014.
dc.identifier.uri.fl_str_mv http://repositorio.unb.br/handle/10482/17003
identifier_str_mv GALLON, Ricardo Fernandes. Política de armazenamento de dados em nuvens federadas para dados biológicos. 2014. viii, 58 f., il. Dissertação (Mestrado em Informática)—Universidade de Brasília, Brasília, 2014.
url http://repositorio.unb.br/handle/10482/17003
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.source.none.fl_str_mv reponame:Repositório Institucional da UnB
instname:Universidade de Brasília (UnB)
instacron:UNB
instname_str Universidade de Brasília (UnB)
instacron_str UNB
institution UNB
reponame_str Repositório Institucional da UnB
collection Repositório Institucional da UnB
bitstream.url.fl_str_mv http://repositorio2.unb.br/jspui/bitstream/10482/17003/1/2014_RicardoFernandesGallon.pdf
http://repositorio2.unb.br/jspui/bitstream/10482/17003/2/license.txt
bitstream.checksum.fl_str_mv 0acfed544c445d0bab511a4a677e857c
0be21ba28de595607fe3af59b285ff0a
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UnB - Universidade de Brasília (UnB)
repository.mail.fl_str_mv
_version_ 1803573633697710080