Proveniência de dados em workflows de bioinformática

Detalhes bibliográficos
Autor(a) principal: Paula, Renato de
Data de Publicação: 2012
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UnB
Texto Completo: http://repositorio.unb.br/handle/10482/12699
Resumo: Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2012.
id UNB_212a6ea829fa8167d9c8af269cfcd334
oai_identifier_str oai:repositorio.unb.br:10482/12699
network_acronym_str UNB
network_name_str Repositório Institucional da UnB
repository_id_str
spelling Proveniência de dados em workflows de bioinformáticaBanco de dadosBiologia computacionalDissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2012.Avanços tecnológicos, tanto em equipamentos quanto em algoritmos, têm tornado a execução de experimentos científicos cada vez mais rápida e eficiente. Isso permite que os cientistas executem mais experimentos e possam compará-los entre si, o que traz maior acurácia às análises. Porém, a quantidade de dados que devem ser tratados aumenta a cada novo experimento executado, o que dificulta a identificação da origem dos dados e como os mesmos foram transformados em cada experimento. Assim, tem-se a necessidade de novas ferramentas que tornem possível preservar, não só as conclusões de um experimento científico, mas também a origem dos dados utilizados e as condições e parâmetros com os quais foram executados. Estudos recentes mostram que a utilização de modelos de proveniência de dados facilita o gerenciamento dos dados tanto em ambiente científico quanto naqueles disponibilizados pela internet. Uma importante área para o uso de proveniência de dados é o da bioinformática, principalmente em projetos genoma e transcritoma de alto desempenho, visto que seus experimentos geram grande volume de dados e seus processos podem ser executados diversas vezes com diferentes ferramentas, dados e parâmetros. Neste trabalho propomos a utilização de uma estrutura de proveniência de dados baseada no modelo PROV-DM para experimentos em projetos de bioinformática a fim de permitir que os cientistas possam trabalhar com seus experimentos em detalhes e, quando necessário, possam consultá-los e reexecutá-los de forma mais planejada e controlada. _____________________________________________________________________________________________________________________________ ABSTRACTTechnological Advances, both in equipment and algorithms, have made the execution of scientific experiments increasingly faster and more e efficient. This allows scientists to execute more experiments and compare them, generating greater accuracy in analyses. However, the great quantity of data to be treated increases with each new experiment performed, which makes it difficult to identify the origin of data and how they were transformed in each experiment. Thus, there is a pressing need for new tools that make possible the preservation of, not only conclusions of scientific experiments, but also the origin of data used and the conditions and parameters with which each were performed. Recent studies show that the use of data provenance models facilitates the management of data, both in the scientific environment and those available on the internet. An important area for the use of data provenance is in bioinformatics, mainly in genome and high performance transcriptome projects, since these experiments generate a large volume of data and their process can be executed many times with different tools, data and parameters. In this work we propose the use of a data provenance structure based on the model PROV-DM for experiments in bioinformatics projects with the objective of allowing scientists to work with their experiments in ne detail, and, when necessary, consult them or re-execute them in a more planned and controlled way.Holanda, Maristela Terto dePaula, Renato de2013-04-03T14:02:55Z2013-04-03T14:02:55Z2013-04-032012-07-11info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfPAULA, Renato de. Proveniência de dados em workflows de bioinformática. 2012. x, 92 f., il. Dissertação (Mestrado em Informática)—Universidade de Brasília, Brasília, 2012.http://repositorio.unb.br/handle/10482/12699info:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UnBinstname:Universidade de Brasília (UnB)instacron:UNB2023-07-14T18:56:22Zoai:repositorio.unb.br:10482/12699Repositório InstitucionalPUBhttps://repositorio.unb.br/oai/requestrepositorio@unb.bropendoar:2023-07-14T18:56:22Repositório Institucional da UnB - Universidade de Brasília (UnB)false
dc.title.none.fl_str_mv Proveniência de dados em workflows de bioinformática
title Proveniência de dados em workflows de bioinformática
spellingShingle Proveniência de dados em workflows de bioinformática
Paula, Renato de
Banco de dados
Biologia computacional
title_short Proveniência de dados em workflows de bioinformática
title_full Proveniência de dados em workflows de bioinformática
title_fullStr Proveniência de dados em workflows de bioinformática
title_full_unstemmed Proveniência de dados em workflows de bioinformática
title_sort Proveniência de dados em workflows de bioinformática
author Paula, Renato de
author_facet Paula, Renato de
author_role author
dc.contributor.none.fl_str_mv Holanda, Maristela Terto de
dc.contributor.author.fl_str_mv Paula, Renato de
dc.subject.por.fl_str_mv Banco de dados
Biologia computacional
topic Banco de dados
Biologia computacional
description Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2012.
publishDate 2012
dc.date.none.fl_str_mv 2012-07-11
2013-04-03T14:02:55Z
2013-04-03T14:02:55Z
2013-04-03
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv PAULA, Renato de. Proveniência de dados em workflows de bioinformática. 2012. x, 92 f., il. Dissertação (Mestrado em Informática)—Universidade de Brasília, Brasília, 2012.
http://repositorio.unb.br/handle/10482/12699
identifier_str_mv PAULA, Renato de. Proveniência de dados em workflows de bioinformática. 2012. x, 92 f., il. Dissertação (Mestrado em Informática)—Universidade de Brasília, Brasília, 2012.
url http://repositorio.unb.br/handle/10482/12699
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UnB
instname:Universidade de Brasília (UnB)
instacron:UNB
instname_str Universidade de Brasília (UnB)
instacron_str UNB
institution UNB
reponame_str Repositório Institucional da UnB
collection Repositório Institucional da UnB
repository.name.fl_str_mv Repositório Institucional da UnB - Universidade de Brasília (UnB)
repository.mail.fl_str_mv repositorio@unb.br
_version_ 1814508297044099072