Proveniência de dados em workflows de bioinformática
Autor(a) principal: | |
---|---|
Data de Publicação: | 2012 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UnB |
Texto Completo: | http://repositorio.unb.br/handle/10482/12699 |
Resumo: | Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2012. |
id |
UNB_212a6ea829fa8167d9c8af269cfcd334 |
---|---|
oai_identifier_str |
oai:repositorio.unb.br:10482/12699 |
network_acronym_str |
UNB |
network_name_str |
Repositório Institucional da UnB |
repository_id_str |
|
spelling |
Proveniência de dados em workflows de bioinformáticaBanco de dadosBiologia computacionalDissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2012.Avanços tecnológicos, tanto em equipamentos quanto em algoritmos, têm tornado a execução de experimentos científicos cada vez mais rápida e eficiente. Isso permite que os cientistas executem mais experimentos e possam compará-los entre si, o que traz maior acurácia às análises. Porém, a quantidade de dados que devem ser tratados aumenta a cada novo experimento executado, o que dificulta a identificação da origem dos dados e como os mesmos foram transformados em cada experimento. Assim, tem-se a necessidade de novas ferramentas que tornem possível preservar, não só as conclusões de um experimento científico, mas também a origem dos dados utilizados e as condições e parâmetros com os quais foram executados. Estudos recentes mostram que a utilização de modelos de proveniência de dados facilita o gerenciamento dos dados tanto em ambiente científico quanto naqueles disponibilizados pela internet. Uma importante área para o uso de proveniência de dados é o da bioinformática, principalmente em projetos genoma e transcritoma de alto desempenho, visto que seus experimentos geram grande volume de dados e seus processos podem ser executados diversas vezes com diferentes ferramentas, dados e parâmetros. Neste trabalho propomos a utilização de uma estrutura de proveniência de dados baseada no modelo PROV-DM para experimentos em projetos de bioinformática a fim de permitir que os cientistas possam trabalhar com seus experimentos em detalhes e, quando necessário, possam consultá-los e reexecutá-los de forma mais planejada e controlada. _____________________________________________________________________________________________________________________________ ABSTRACTTechnological Advances, both in equipment and algorithms, have made the execution of scientific experiments increasingly faster and more e efficient. This allows scientists to execute more experiments and compare them, generating greater accuracy in analyses. However, the great quantity of data to be treated increases with each new experiment performed, which makes it difficult to identify the origin of data and how they were transformed in each experiment. Thus, there is a pressing need for new tools that make possible the preservation of, not only conclusions of scientific experiments, but also the origin of data used and the conditions and parameters with which each were performed. Recent studies show that the use of data provenance models facilitates the management of data, both in the scientific environment and those available on the internet. An important area for the use of data provenance is in bioinformatics, mainly in genome and high performance transcriptome projects, since these experiments generate a large volume of data and their process can be executed many times with different tools, data and parameters. In this work we propose the use of a data provenance structure based on the model PROV-DM for experiments in bioinformatics projects with the objective of allowing scientists to work with their experiments in ne detail, and, when necessary, consult them or re-execute them in a more planned and controlled way.Holanda, Maristela Terto dePaula, Renato de2013-04-03T14:02:55Z2013-04-03T14:02:55Z2013-04-032012-07-11info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfPAULA, Renato de. Proveniência de dados em workflows de bioinformática. 2012. x, 92 f., il. Dissertação (Mestrado em Informática)—Universidade de Brasília, Brasília, 2012.http://repositorio.unb.br/handle/10482/12699info:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UnBinstname:Universidade de Brasília (UnB)instacron:UNB2023-07-14T18:56:22Zoai:repositorio.unb.br:10482/12699Repositório InstitucionalPUBhttps://repositorio.unb.br/oai/requestrepositorio@unb.bropendoar:2023-07-14T18:56:22Repositório Institucional da UnB - Universidade de Brasília (UnB)false |
dc.title.none.fl_str_mv |
Proveniência de dados em workflows de bioinformática |
title |
Proveniência de dados em workflows de bioinformática |
spellingShingle |
Proveniência de dados em workflows de bioinformática Paula, Renato de Banco de dados Biologia computacional |
title_short |
Proveniência de dados em workflows de bioinformática |
title_full |
Proveniência de dados em workflows de bioinformática |
title_fullStr |
Proveniência de dados em workflows de bioinformática |
title_full_unstemmed |
Proveniência de dados em workflows de bioinformática |
title_sort |
Proveniência de dados em workflows de bioinformática |
author |
Paula, Renato de |
author_facet |
Paula, Renato de |
author_role |
author |
dc.contributor.none.fl_str_mv |
Holanda, Maristela Terto de |
dc.contributor.author.fl_str_mv |
Paula, Renato de |
dc.subject.por.fl_str_mv |
Banco de dados Biologia computacional |
topic |
Banco de dados Biologia computacional |
description |
Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2012. |
publishDate |
2012 |
dc.date.none.fl_str_mv |
2012-07-11 2013-04-03T14:02:55Z 2013-04-03T14:02:55Z 2013-04-03 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
PAULA, Renato de. Proveniência de dados em workflows de bioinformática. 2012. x, 92 f., il. Dissertação (Mestrado em Informática)—Universidade de Brasília, Brasília, 2012. http://repositorio.unb.br/handle/10482/12699 |
identifier_str_mv |
PAULA, Renato de. Proveniência de dados em workflows de bioinformática. 2012. x, 92 f., il. Dissertação (Mestrado em Informática)—Universidade de Brasília, Brasília, 2012. |
url |
http://repositorio.unb.br/handle/10482/12699 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UnB instname:Universidade de Brasília (UnB) instacron:UNB |
instname_str |
Universidade de Brasília (UnB) |
instacron_str |
UNB |
institution |
UNB |
reponame_str |
Repositório Institucional da UnB |
collection |
Repositório Institucional da UnB |
repository.name.fl_str_mv |
Repositório Institucional da UnB - Universidade de Brasília (UnB) |
repository.mail.fl_str_mv |
repositorio@unb.br |
_version_ |
1814508297044099072 |