Comparação paralela exata de seqüências biológicas longas com uso limitado de memória

Detalhes bibliográficos
Autor(a) principal: Batista, Rodolfo Bezerra
Data de Publicação: 2006
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UnB
Texto Completo: http://repositorio.unb.br/handle/10482/2183
Resumo: Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2006.
id UNB_22709e8dd0c088d330f5e1655674edda
oai_identifier_str oai:repositorio.unb.br:10482/2183
network_acronym_str UNB
network_name_str Repositório Institucional da UnB
repository_id_str
spelling Comparação paralela exata de seqüências biológicas longas com uso limitado de memóriaBioinformáticaBiologia computacionalProgramação paralela (Computação)Sequências biológicasDissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2006.O alinhamento de seqüências biológicas é um método muito importante usado pela biologia computacional para relacionar organismos e compreender os processos evolutivos envolvidos entre eles. O algoritmo de Smith-Waterman, método exato para obtenção de alinhamentos locais ótimos entre seqüências de DNA (ácido desoxirribonucleico), possui complexidade O(n2) tanto de espaço quanto de tempo. Esta complexidade é um obstáculo à comparação de seqüências muito longas. O BLAST é uma ferramenta capaz de produzir alinhamentos locais em curto espaço de tempo e baixo custo de memória. No entanto, a sensibilidade dos resultados produzidos é baixa em comparação aos métodos exatos, devido às heurísticas utilizadas no BLAST. A programação paralela é utilizada para lidar com problemas computacionais que demandam muito tempo de processamento. Clusters de computadores provêm alto poder computacional a baixo custo. Entretanto, para se ter benefícios com o uso de clusters, os problemas precisam ser adaptados antes de serem resolvidos sobre tal plataforma computacional. A presente dissertação propõe uma estratégia paralela exata para a comparação de seqüências longas de DNA em um espaço limitado de memória. A estratégia proposta foi implementada em um cluster de estações de trabalho, atingindo speedups muito bons para seqüências maiores que 50Kbp e sendo capaz de produzir alinhamentos locais ótimos para seqüências de mais de 3 milhões de pares de bases. ____________________________________________________________________________________________ ABSTRACTBiological sequence alignment is a very important method used by computational biology to relate organisms and understand the evolutionary processes involved between them. The Smith-Waterman algorithm, an exact method used to obtain optimal local alignments between DNA (deoxyribonucleic acid) sequences, has O(n2) space and time complexity. This complexity is an obstacle to the comparison of very long sequences. BLAST is a tool capable of producing local alignments in short time at a low memory cost. However, the results produced have a low sensibility when compared to exact methods, due to the heuristics used in BLAST. Parallel programming is used to deal with high processing time demanding computational problems. Clusters of computers provide high computational power at low cost. However, in order to have benefits with the use of clusters, the problems must be adapted before being solved on such computational platform. The present dissertation proposes an exact parallel strategy to the comparison of long DNA sequences in limited memory space. The proposed strategy was implemented in a cluster of workstations, reaching very good speedups for sequences longer than 50Kbp and being able to produce optimal local alignments for sequences with over 3 million base pairs.Instituto de Ciências Exatas (IE)Departamento de Ciência da Computação (IE CIC)Programa de Pós-Graduação em InformáticaMelo, Alba Cristina Magalhães Alves deBatista, Rodolfo Bezerra2009-11-16T14:30:34Z2009-11-16T14:30:34Z2009-11-162006-03-20info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfBATISTA, Rodolfo Bezerra. Comparação paralela exata de seqüências biológicas longas com uso limitado de memória. 105 f. 2006. Dissertação (Mestrado em Informática)-Universidade de Brasília, Brasília, 2006.http://repositorio.unb.br/handle/10482/2183info:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UnBinstname:Universidade de Brasília (UnB)instacron:UNB2024-03-14T15:40:52Zoai:repositorio.unb.br:10482/2183Repositório InstitucionalPUBhttps://repositorio.unb.br/oai/requestrepositorio@unb.bropendoar:2024-03-14T15:40:52Repositório Institucional da UnB - Universidade de Brasília (UnB)false
dc.title.none.fl_str_mv Comparação paralela exata de seqüências biológicas longas com uso limitado de memória
title Comparação paralela exata de seqüências biológicas longas com uso limitado de memória
spellingShingle Comparação paralela exata de seqüências biológicas longas com uso limitado de memória
Batista, Rodolfo Bezerra
Bioinformática
Biologia computacional
Programação paralela (Computação)
Sequências biológicas
title_short Comparação paralela exata de seqüências biológicas longas com uso limitado de memória
title_full Comparação paralela exata de seqüências biológicas longas com uso limitado de memória
title_fullStr Comparação paralela exata de seqüências biológicas longas com uso limitado de memória
title_full_unstemmed Comparação paralela exata de seqüências biológicas longas com uso limitado de memória
title_sort Comparação paralela exata de seqüências biológicas longas com uso limitado de memória
author Batista, Rodolfo Bezerra
author_facet Batista, Rodolfo Bezerra
author_role author
dc.contributor.none.fl_str_mv Melo, Alba Cristina Magalhães Alves de
dc.contributor.author.fl_str_mv Batista, Rodolfo Bezerra
dc.subject.por.fl_str_mv Bioinformática
Biologia computacional
Programação paralela (Computação)
Sequências biológicas
topic Bioinformática
Biologia computacional
Programação paralela (Computação)
Sequências biológicas
description Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2006.
publishDate 2006
dc.date.none.fl_str_mv 2006-03-20
2009-11-16T14:30:34Z
2009-11-16T14:30:34Z
2009-11-16
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv BATISTA, Rodolfo Bezerra. Comparação paralela exata de seqüências biológicas longas com uso limitado de memória. 105 f. 2006. Dissertação (Mestrado em Informática)-Universidade de Brasília, Brasília, 2006.
http://repositorio.unb.br/handle/10482/2183
identifier_str_mv BATISTA, Rodolfo Bezerra. Comparação paralela exata de seqüências biológicas longas com uso limitado de memória. 105 f. 2006. Dissertação (Mestrado em Informática)-Universidade de Brasília, Brasília, 2006.
url http://repositorio.unb.br/handle/10482/2183
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UnB
instname:Universidade de Brasília (UnB)
instacron:UNB
instname_str Universidade de Brasília (UnB)
instacron_str UNB
institution UNB
reponame_str Repositório Institucional da UnB
collection Repositório Institucional da UnB
repository.name.fl_str_mv Repositório Institucional da UnB - Universidade de Brasília (UnB)
repository.mail.fl_str_mv repositorio@unb.br
_version_ 1814508177206542336