Fickett-CUDAlign : comparação paralela de sequências biológicas com estratégia multi-bloco de faixas ajustáveis

Detalhes bibliográficos
Autor(a) principal: Silva, Gabriel Heleno Gonçalves da
Data de Publicação: 2016
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UnB
Texto Completo: http://repositorio.unb.br/handle/10482/20263
http://dx.doi.org/10.26512/2016.03.D.20263
Resumo: Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, Programa de Pós-Graducação em Informática, 2016.
id UNB_aae209bf325be59b3c08d68da5dfefd9
oai_identifier_str oai:repositorio.unb.br:10482/20263
network_acronym_str UNB
network_name_str Repositório Institucional da UnB
repository_id_str
spelling Fickett-CUDAlign : comparação paralela de sequências biológicas com estratégia multi-bloco de faixas ajustáveisProcessamento paralelo (Computação)Alinhamento de sequênciasAlgoritmos de computadorBioinformáticaAlgoritmo de FickettDissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, Programa de Pós-Graducação em Informática, 2016.A comparação de sequências biológicas é uma operação importante na Bioinformática, que é realizada frequentemente. Os algoritmos exatos para comparação de sequências obtêm o resultado ótimo calculando uma ou mais matrizes de programação dinâmica.Estes algoritmos têm complexidade de tempo O(mn), onde m e n são os tamanhos das sequências. Fickettpropôs um algoritmo que é capaz de reduzir a complexidade paraO(kn), onde k é a faixa decomputação e representa a quantidade de diagonais da matrizefetivamente calculadas. Nessa dissertação de mestrado, propomos e avaliamos oFickett-CUDAlign, uma estratégia paralela que divide a comparação de sequências emmúltiplas comparações de subsequências e calcula uma faixa de Fickett apropriada paracada comparação de sequência (bloco). Com estaabordagem, nós reduzimos potencialmenteo número de células calculadas, quando comparada ao Fickett, que usa uma únicafaixa para toda a comparação. Nossa estratégia multi-bloco ajustável foi programada emC/C++ e pthreadse foi integrada ao estágio 4 do CUDAlign, uma ferramenta do estadoda arte para comparações ótimas de sequências biológicas. O Fickett-CUDAlign foi usadopara comparar sequências reais de DNA cujo tamanho variou de 10KBP (Milhares dePares de Base) a 47MBP (Milhões de Pares de Base),alcançando um speedup de 59,60xna comparação 10MBP x 10MBP, quando comparado aoestágio 4 do CUDAlign. Nestecaso, o tempo de execução foi reduzido de 53,56 segundos para 0,90 segundo.Biological sequence comparison is an important task in Bioinformatics, which is frequently performed. The exact algorithms for sequence comparison obtain the optimal result by calculating one or more dynamic programming matrices. These algorithms have O(mn) time complexity, where m and n are the sizes of the sequences. Fickett proposed an algorithm which is able to reduce time complexity to O(kn), where k is the computation band and represents the amount of matrix diagonals actually calculated. In this MSc Dissertation, we propose and evaluate Fickett-CUDAlign, a parallel strategy that splits a pairwise sequence comparison in multiple comparisons of subsequences and calculates an appropriate Fickett band to each subsequence comparison (block). With this approach, we potentially reduce the number of cells calculated, when compared to Fickett, which uses a unique band to the whole comparison. Our adjustable multi-block strategy was programmed in C/C++ and pthreads and was integrated to the stage 4 of CUDAlign, a state-of-the-art tool for optimal biological sequence comparison. Fickett-CUDAlign was used to compare real DNA sequences whose sizes ranged from 10KBP (Thousands of Base Pairs) to 47MBP (Millions of Base Pairs), reaching a speedup of 59.60x in the 10MBP x 10MBP comparison, when compared to CUDAlign’s stage 4. In this case, the execution time was reduced from 53.56 seconds to 0.90 second.Melo, Alba Cristina Magalhães Alves deSilva, Gabriel Heleno Gonçalves da2016-05-16T17:20:02Z2016-05-16T17:20:02Z2016-05-162016-03-22info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfSILVA, Gabriel Heleno Gonçalves da. Fickett-CUDAlign: comparação paralela de sequências biológicas com estratégia multi-bloco de faixas ajustáveis. 2016. xii, 72 f., il. Dissertação (Mestrado em Informática)—Universidade de Brasília, Brasília, 2016.http://repositorio.unb.br/handle/10482/20263http://dx.doi.org/10.26512/2016.03.D.20263A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.bce.unb.br, www.ibict.br, http://hercules.vtls.com/cgi-bin/ndltd/chameleon?lng=pt&skin=ndltd sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data.info:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UnBinstname:Universidade de Brasília (UnB)instacron:UNB2023-07-14T18:56:19Zoai:repositorio.unb.br:10482/20263Repositório InstitucionalPUBhttps://repositorio.unb.br/oai/requestrepositorio@unb.bropendoar:2023-07-14T18:56:19Repositório Institucional da UnB - Universidade de Brasília (UnB)false
dc.title.none.fl_str_mv Fickett-CUDAlign : comparação paralela de sequências biológicas com estratégia multi-bloco de faixas ajustáveis
title Fickett-CUDAlign : comparação paralela de sequências biológicas com estratégia multi-bloco de faixas ajustáveis
spellingShingle Fickett-CUDAlign : comparação paralela de sequências biológicas com estratégia multi-bloco de faixas ajustáveis
Silva, Gabriel Heleno Gonçalves da
Processamento paralelo (Computação)
Alinhamento de sequências
Algoritmos de computador
Bioinformática
Algoritmo de Fickett
title_short Fickett-CUDAlign : comparação paralela de sequências biológicas com estratégia multi-bloco de faixas ajustáveis
title_full Fickett-CUDAlign : comparação paralela de sequências biológicas com estratégia multi-bloco de faixas ajustáveis
title_fullStr Fickett-CUDAlign : comparação paralela de sequências biológicas com estratégia multi-bloco de faixas ajustáveis
title_full_unstemmed Fickett-CUDAlign : comparação paralela de sequências biológicas com estratégia multi-bloco de faixas ajustáveis
title_sort Fickett-CUDAlign : comparação paralela de sequências biológicas com estratégia multi-bloco de faixas ajustáveis
author Silva, Gabriel Heleno Gonçalves da
author_facet Silva, Gabriel Heleno Gonçalves da
author_role author
dc.contributor.none.fl_str_mv Melo, Alba Cristina Magalhães Alves de
dc.contributor.author.fl_str_mv Silva, Gabriel Heleno Gonçalves da
dc.subject.por.fl_str_mv Processamento paralelo (Computação)
Alinhamento de sequências
Algoritmos de computador
Bioinformática
Algoritmo de Fickett
topic Processamento paralelo (Computação)
Alinhamento de sequências
Algoritmos de computador
Bioinformática
Algoritmo de Fickett
description Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, Programa de Pós-Graducação em Informática, 2016.
publishDate 2016
dc.date.none.fl_str_mv 2016-05-16T17:20:02Z
2016-05-16T17:20:02Z
2016-05-16
2016-03-22
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv SILVA, Gabriel Heleno Gonçalves da. Fickett-CUDAlign: comparação paralela de sequências biológicas com estratégia multi-bloco de faixas ajustáveis. 2016. xii, 72 f., il. Dissertação (Mestrado em Informática)—Universidade de Brasília, Brasília, 2016.
http://repositorio.unb.br/handle/10482/20263
http://dx.doi.org/10.26512/2016.03.D.20263
identifier_str_mv SILVA, Gabriel Heleno Gonçalves da. Fickett-CUDAlign: comparação paralela de sequências biológicas com estratégia multi-bloco de faixas ajustáveis. 2016. xii, 72 f., il. Dissertação (Mestrado em Informática)—Universidade de Brasília, Brasília, 2016.
url http://repositorio.unb.br/handle/10482/20263
http://dx.doi.org/10.26512/2016.03.D.20263
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UnB
instname:Universidade de Brasília (UnB)
instacron:UNB
instname_str Universidade de Brasília (UnB)
instacron_str UNB
institution UNB
reponame_str Repositório Institucional da UnB
collection Repositório Institucional da UnB
repository.name.fl_str_mv Repositório Institucional da UnB - Universidade de Brasília (UnB)
repository.mail.fl_str_mv repositorio@unb.br
_version_ 1814508246161948672