Fickett-CUDAlign : comparação paralela de sequências biológicas com estratégia multi-bloco de faixas ajustáveis
Autor(a) principal: | |
---|---|
Data de Publicação: | 2016 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UnB |
Texto Completo: | http://repositorio.unb.br/handle/10482/20263 http://dx.doi.org/10.26512/2016.03.D.20263 |
Resumo: | Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, Programa de Pós-Graducação em Informática, 2016. |
id |
UNB_aae209bf325be59b3c08d68da5dfefd9 |
---|---|
oai_identifier_str |
oai:repositorio.unb.br:10482/20263 |
network_acronym_str |
UNB |
network_name_str |
Repositório Institucional da UnB |
repository_id_str |
|
spelling |
Fickett-CUDAlign : comparação paralela de sequências biológicas com estratégia multi-bloco de faixas ajustáveisProcessamento paralelo (Computação)Alinhamento de sequênciasAlgoritmos de computadorBioinformáticaAlgoritmo de FickettDissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, Programa de Pós-Graducação em Informática, 2016.A comparação de sequências biológicas é uma operação importante na Bioinformática, que é realizada frequentemente. Os algoritmos exatos para comparação de sequências obtêm o resultado ótimo calculando uma ou mais matrizes de programação dinâmica.Estes algoritmos têm complexidade de tempo O(mn), onde m e n são os tamanhos das sequências. Fickettpropôs um algoritmo que é capaz de reduzir a complexidade paraO(kn), onde k é a faixa decomputação e representa a quantidade de diagonais da matrizefetivamente calculadas. Nessa dissertação de mestrado, propomos e avaliamos oFickett-CUDAlign, uma estratégia paralela que divide a comparação de sequências emmúltiplas comparações de subsequências e calcula uma faixa de Fickett apropriada paracada comparação de sequência (bloco). Com estaabordagem, nós reduzimos potencialmenteo número de células calculadas, quando comparada ao Fickett, que usa uma únicafaixa para toda a comparação. Nossa estratégia multi-bloco ajustável foi programada emC/C++ e pthreadse foi integrada ao estágio 4 do CUDAlign, uma ferramenta do estadoda arte para comparações ótimas de sequências biológicas. O Fickett-CUDAlign foi usadopara comparar sequências reais de DNA cujo tamanho variou de 10KBP (Milhares dePares de Base) a 47MBP (Milhões de Pares de Base),alcançando um speedup de 59,60xna comparação 10MBP x 10MBP, quando comparado aoestágio 4 do CUDAlign. Nestecaso, o tempo de execução foi reduzido de 53,56 segundos para 0,90 segundo.Biological sequence comparison is an important task in Bioinformatics, which is frequently performed. The exact algorithms for sequence comparison obtain the optimal result by calculating one or more dynamic programming matrices. These algorithms have O(mn) time complexity, where m and n are the sizes of the sequences. Fickett proposed an algorithm which is able to reduce time complexity to O(kn), where k is the computation band and represents the amount of matrix diagonals actually calculated. In this MSc Dissertation, we propose and evaluate Fickett-CUDAlign, a parallel strategy that splits a pairwise sequence comparison in multiple comparisons of subsequences and calculates an appropriate Fickett band to each subsequence comparison (block). With this approach, we potentially reduce the number of cells calculated, when compared to Fickett, which uses a unique band to the whole comparison. Our adjustable multi-block strategy was programmed in C/C++ and pthreads and was integrated to the stage 4 of CUDAlign, a state-of-the-art tool for optimal biological sequence comparison. Fickett-CUDAlign was used to compare real DNA sequences whose sizes ranged from 10KBP (Thousands of Base Pairs) to 47MBP (Millions of Base Pairs), reaching a speedup of 59.60x in the 10MBP x 10MBP comparison, when compared to CUDAlign’s stage 4. In this case, the execution time was reduced from 53.56 seconds to 0.90 second.Melo, Alba Cristina Magalhães Alves deSilva, Gabriel Heleno Gonçalves da2016-05-16T17:20:02Z2016-05-16T17:20:02Z2016-05-162016-03-22info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfSILVA, Gabriel Heleno Gonçalves da. Fickett-CUDAlign: comparação paralela de sequências biológicas com estratégia multi-bloco de faixas ajustáveis. 2016. xii, 72 f., il. Dissertação (Mestrado em Informática)—Universidade de Brasília, Brasília, 2016.http://repositorio.unb.br/handle/10482/20263http://dx.doi.org/10.26512/2016.03.D.20263A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.bce.unb.br, www.ibict.br, http://hercules.vtls.com/cgi-bin/ndltd/chameleon?lng=pt&skin=ndltd sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data.info:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UnBinstname:Universidade de Brasília (UnB)instacron:UNB2023-07-14T18:56:19Zoai:repositorio.unb.br:10482/20263Repositório InstitucionalPUBhttps://repositorio.unb.br/oai/requestrepositorio@unb.bropendoar:2023-07-14T18:56:19Repositório Institucional da UnB - Universidade de Brasília (UnB)false |
dc.title.none.fl_str_mv |
Fickett-CUDAlign : comparação paralela de sequências biológicas com estratégia multi-bloco de faixas ajustáveis |
title |
Fickett-CUDAlign : comparação paralela de sequências biológicas com estratégia multi-bloco de faixas ajustáveis |
spellingShingle |
Fickett-CUDAlign : comparação paralela de sequências biológicas com estratégia multi-bloco de faixas ajustáveis Silva, Gabriel Heleno Gonçalves da Processamento paralelo (Computação) Alinhamento de sequências Algoritmos de computador Bioinformática Algoritmo de Fickett |
title_short |
Fickett-CUDAlign : comparação paralela de sequências biológicas com estratégia multi-bloco de faixas ajustáveis |
title_full |
Fickett-CUDAlign : comparação paralela de sequências biológicas com estratégia multi-bloco de faixas ajustáveis |
title_fullStr |
Fickett-CUDAlign : comparação paralela de sequências biológicas com estratégia multi-bloco de faixas ajustáveis |
title_full_unstemmed |
Fickett-CUDAlign : comparação paralela de sequências biológicas com estratégia multi-bloco de faixas ajustáveis |
title_sort |
Fickett-CUDAlign : comparação paralela de sequências biológicas com estratégia multi-bloco de faixas ajustáveis |
author |
Silva, Gabriel Heleno Gonçalves da |
author_facet |
Silva, Gabriel Heleno Gonçalves da |
author_role |
author |
dc.contributor.none.fl_str_mv |
Melo, Alba Cristina Magalhães Alves de |
dc.contributor.author.fl_str_mv |
Silva, Gabriel Heleno Gonçalves da |
dc.subject.por.fl_str_mv |
Processamento paralelo (Computação) Alinhamento de sequências Algoritmos de computador Bioinformática Algoritmo de Fickett |
topic |
Processamento paralelo (Computação) Alinhamento de sequências Algoritmos de computador Bioinformática Algoritmo de Fickett |
description |
Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, Programa de Pós-Graducação em Informática, 2016. |
publishDate |
2016 |
dc.date.none.fl_str_mv |
2016-05-16T17:20:02Z 2016-05-16T17:20:02Z 2016-05-16 2016-03-22 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
SILVA, Gabriel Heleno Gonçalves da. Fickett-CUDAlign: comparação paralela de sequências biológicas com estratégia multi-bloco de faixas ajustáveis. 2016. xii, 72 f., il. Dissertação (Mestrado em Informática)—Universidade de Brasília, Brasília, 2016. http://repositorio.unb.br/handle/10482/20263 http://dx.doi.org/10.26512/2016.03.D.20263 |
identifier_str_mv |
SILVA, Gabriel Heleno Gonçalves da. Fickett-CUDAlign: comparação paralela de sequências biológicas com estratégia multi-bloco de faixas ajustáveis. 2016. xii, 72 f., il. Dissertação (Mestrado em Informática)—Universidade de Brasília, Brasília, 2016. |
url |
http://repositorio.unb.br/handle/10482/20263 http://dx.doi.org/10.26512/2016.03.D.20263 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UnB instname:Universidade de Brasília (UnB) instacron:UNB |
instname_str |
Universidade de Brasília (UnB) |
instacron_str |
UNB |
institution |
UNB |
reponame_str |
Repositório Institucional da UnB |
collection |
Repositório Institucional da UnB |
repository.name.fl_str_mv |
Repositório Institucional da UnB - Universidade de Brasília (UnB) |
repository.mail.fl_str_mv |
repositorio@unb.br |
_version_ |
1814508246161948672 |