Comparação paralela exata de seqüências biológicas longas com uso limitado de memória
Autor(a) principal: | |
---|---|
Data de Publicação: | 2006 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UnB |
Texto Completo: | http://repositorio.unb.br/handle/10482/2183 |
Resumo: | Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2006. |
id |
UNB_22709e8dd0c088d330f5e1655674edda |
---|---|
oai_identifier_str |
oai:repositorio.unb.br:10482/2183 |
network_acronym_str |
UNB |
network_name_str |
Repositório Institucional da UnB |
repository_id_str |
|
spelling |
Comparação paralela exata de seqüências biológicas longas com uso limitado de memóriaBioinformáticaBiologia computacionalProgramação paralela (Computação)Sequências biológicasDissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2006.O alinhamento de seqüências biológicas é um método muito importante usado pela biologia computacional para relacionar organismos e compreender os processos evolutivos envolvidos entre eles. O algoritmo de Smith-Waterman, método exato para obtenção de alinhamentos locais ótimos entre seqüências de DNA (ácido desoxirribonucleico), possui complexidade O(n2) tanto de espaço quanto de tempo. Esta complexidade é um obstáculo à comparação de seqüências muito longas. O BLAST é uma ferramenta capaz de produzir alinhamentos locais em curto espaço de tempo e baixo custo de memória. No entanto, a sensibilidade dos resultados produzidos é baixa em comparação aos métodos exatos, devido às heurísticas utilizadas no BLAST. A programação paralela é utilizada para lidar com problemas computacionais que demandam muito tempo de processamento. Clusters de computadores provêm alto poder computacional a baixo custo. Entretanto, para se ter benefícios com o uso de clusters, os problemas precisam ser adaptados antes de serem resolvidos sobre tal plataforma computacional. A presente dissertação propõe uma estratégia paralela exata para a comparação de seqüências longas de DNA em um espaço limitado de memória. A estratégia proposta foi implementada em um cluster de estações de trabalho, atingindo speedups muito bons para seqüências maiores que 50Kbp e sendo capaz de produzir alinhamentos locais ótimos para seqüências de mais de 3 milhões de pares de bases. ____________________________________________________________________________________________ ABSTRACTBiological sequence alignment is a very important method used by computational biology to relate organisms and understand the evolutionary processes involved between them. The Smith-Waterman algorithm, an exact method used to obtain optimal local alignments between DNA (deoxyribonucleic acid) sequences, has O(n2) space and time complexity. This complexity is an obstacle to the comparison of very long sequences. BLAST is a tool capable of producing local alignments in short time at a low memory cost. However, the results produced have a low sensibility when compared to exact methods, due to the heuristics used in BLAST. Parallel programming is used to deal with high processing time demanding computational problems. Clusters of computers provide high computational power at low cost. However, in order to have benefits with the use of clusters, the problems must be adapted before being solved on such computational platform. The present dissertation proposes an exact parallel strategy to the comparison of long DNA sequences in limited memory space. The proposed strategy was implemented in a cluster of workstations, reaching very good speedups for sequences longer than 50Kbp and being able to produce optimal local alignments for sequences with over 3 million base pairs.Instituto de Ciências Exatas (IE)Departamento de Ciência da Computação (IE CIC)Programa de Pós-Graduação em InformáticaMelo, Alba Cristina Magalhães Alves deBatista, Rodolfo Bezerra2009-11-16T14:30:34Z2009-11-16T14:30:34Z2009-11-162006-03-20info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfBATISTA, Rodolfo Bezerra. Comparação paralela exata de seqüências biológicas longas com uso limitado de memória. 105 f. 2006. Dissertação (Mestrado em Informática)-Universidade de Brasília, Brasília, 2006.http://repositorio.unb.br/handle/10482/2183info:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UnBinstname:Universidade de Brasília (UnB)instacron:UNB2024-03-14T15:40:52Zoai:repositorio.unb.br:10482/2183Repositório InstitucionalPUBhttps://repositorio.unb.br/oai/requestrepositorio@unb.bropendoar:2024-03-14T15:40:52Repositório Institucional da UnB - Universidade de Brasília (UnB)false |
dc.title.none.fl_str_mv |
Comparação paralela exata de seqüências biológicas longas com uso limitado de memória |
title |
Comparação paralela exata de seqüências biológicas longas com uso limitado de memória |
spellingShingle |
Comparação paralela exata de seqüências biológicas longas com uso limitado de memória Batista, Rodolfo Bezerra Bioinformática Biologia computacional Programação paralela (Computação) Sequências biológicas |
title_short |
Comparação paralela exata de seqüências biológicas longas com uso limitado de memória |
title_full |
Comparação paralela exata de seqüências biológicas longas com uso limitado de memória |
title_fullStr |
Comparação paralela exata de seqüências biológicas longas com uso limitado de memória |
title_full_unstemmed |
Comparação paralela exata de seqüências biológicas longas com uso limitado de memória |
title_sort |
Comparação paralela exata de seqüências biológicas longas com uso limitado de memória |
author |
Batista, Rodolfo Bezerra |
author_facet |
Batista, Rodolfo Bezerra |
author_role |
author |
dc.contributor.none.fl_str_mv |
Melo, Alba Cristina Magalhães Alves de |
dc.contributor.author.fl_str_mv |
Batista, Rodolfo Bezerra |
dc.subject.por.fl_str_mv |
Bioinformática Biologia computacional Programação paralela (Computação) Sequências biológicas |
topic |
Bioinformática Biologia computacional Programação paralela (Computação) Sequências biológicas |
description |
Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2006. |
publishDate |
2006 |
dc.date.none.fl_str_mv |
2006-03-20 2009-11-16T14:30:34Z 2009-11-16T14:30:34Z 2009-11-16 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
BATISTA, Rodolfo Bezerra. Comparação paralela exata de seqüências biológicas longas com uso limitado de memória. 105 f. 2006. Dissertação (Mestrado em Informática)-Universidade de Brasília, Brasília, 2006. http://repositorio.unb.br/handle/10482/2183 |
identifier_str_mv |
BATISTA, Rodolfo Bezerra. Comparação paralela exata de seqüências biológicas longas com uso limitado de memória. 105 f. 2006. Dissertação (Mestrado em Informática)-Universidade de Brasília, Brasília, 2006. |
url |
http://repositorio.unb.br/handle/10482/2183 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UnB instname:Universidade de Brasília (UnB) instacron:UNB |
instname_str |
Universidade de Brasília (UnB) |
instacron_str |
UNB |
institution |
UNB |
reponame_str |
Repositório Institucional da UnB |
collection |
Repositório Institucional da UnB |
repository.name.fl_str_mv |
Repositório Institucional da UnB - Universidade de Brasília (UnB) |
repository.mail.fl_str_mv |
repositorio@unb.br |
_version_ |
1814508177206542336 |