Alinhamento múltiplo de sequências com A-Star paralelo em cluster MPI

Detalhes bibliográficos
Autor(a) principal: Ferreira, Gabriel de C.
Data de Publicação: 2016
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Biblioteca Digital de Monografias da UnB
Texto Completo: http://bdm.unb.br/handle/10483/15790
Resumo: Trabalho de conclusão de curso (graduação)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2016.
id UNB-2_a5be387fca2d746ecd4d466f4d1bee7f
oai_identifier_str oai:bdm.unb.br:10483/15790
network_acronym_str UNB-2
network_name_str Biblioteca Digital de Monografias da UnB
repository_id_str 11571
spelling Ferreira, Gabriel de C.Melo, Alba Cristina Magalhães Alves deFERREIRA, Gabriel de C. Alinhamento múltiplo de sequências com A-Star paralelo em cluster MPI. 2016. xi, 75 f., il. Trabalho de conclusão de curso (Bacharelado em Ciência da Computação)—Universidade de Brasília, Brasília, 2016.http://bdm.unb.br/handle/10483/15790Trabalho de conclusão de curso (graduação)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2016.O alinhamento múltiplo de sequências visa ressaltar as similaridades e diferenças em um conjunto de sequências biológicas. O alinhamento múltiplo com a soma de pares é um problema NP-Difícil e métodos heurísticos são usados para solucioná-lo, porém esses métodos não garantem que o resultado ótimo será produzido. Algumas das técnicas exatas que produzem o resultado ótimo são baseadas no algoritmo de busca A-Star, sendo uma delas o A-Star Paralelo (PA-Star). O PA-Star divide o espaço de busca entre múltiplas threads, acelerando a obtenção de resultados, contudo tem sua execução limitada a uma única máquina. O objetivo deste trabalho de graduação é propor, implementar e avaliar o MPI-PAStar, uma estratégia que permita reduzir o tempo de busca ao executar o PA-Star em diversas máquinas, utilizando o ambiente MPI para trocar mensagens, distribuindo carga de trabalho entre as máquinas. O MPI-PAStar adiciona ao PA-Star um pool de threads de processamento de mensagens e duas threads responsáveis pelo envio e recebimento de mensagens. Diversas estratégias são utilizadas para reduzir o tráfego de dados e a latência de rede, como a serialização de blocos de carga de trabalho e compactação destes antes do envio, reduzindo efeitos colaterais negativos da rede sobre a computação do alinhamento. Os resultados do MPI-PAStar apresentaram ganhos de até 36.8% no tempo de busca do alinhamento ótimo e de até 29,7% no tempo total de execução do programa, quando comparado ao PA-Star, a depender do número e similaridade das sequências sendo alinhadas, além do comprimento da maior sequência.Submitted by Aline Almeida (alinealmeida@bce.unb.br) on 2016-10-10T19:36:14Z No. of bitstreams: 3 license_text: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) 2016_GabrielDeCFerreira_tcc.pdf: 1955137 bytes, checksum: a5cc4600f5b8cd85d6f29cd4fbaee996 (MD5)Approved for entry into archive by Luanna Maia (luanna@bce.unb.br) on 2017-01-18T13:47:49Z (GMT) No. of bitstreams: 3 license_text: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) 2016_GabrielDeCFerreira_tcc.pdf: 1955137 bytes, checksum: a5cc4600f5b8cd85d6f29cd4fbaee996 (MD5)Made available in DSpace on 2017-01-18T13:47:49Z (GMT). No. of bitstreams: 3 license_text: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) 2016_GabrielDeCFerreira_tcc.pdf: 1955137 bytes, checksum: a5cc4600f5b8cd85d6f29cd4fbaee996 (MD5)The multiple sequence alignment purpose is to highlight similarities and differences between a set of biological sequences. The multiple alignment is an NP-Hard problem and heuristic methods are used to solve it, however those do not guarantee that an optimal result is produced. Some exact techniques that can produce an optimal result are based on the A-Star graph search algorithm, being one of them the Parallel A-Star (PA-Star). The PA-Star divides the search space to multiple threads, accelerating the search for the result, but its execution is limited to a single machine. The objective of this undergraduate work is to propose, implement and evaluate the MPI-PAStar, a strategy that allows the reduction of the search time by executing the PA-Star on multiple machines, using the MPI environment to exchange messages, distributing the workload across different machines. The MPI-PAStar adds to PA-Star a pool of message processing threads and two threads responsible for sending and receiving messages. Multiple strategies are used to reduce network traffic and latency, like serialized workload blocks and compressing them before sending them, reducing negative network effects over the alignment computation. Results obtained with the MPI-PAStar showed that it can yield up to 36.8% reduction in terms of alignment time and up to 29.7% in terms of total execution time, depending on the number of sequences being aligned, the length of longest sequence and the content of the sequences.Alinhamento Múltiplo de Sequências (MSA)Algoritmos de computadorProcessamento paralelo (Computadores)Alinhamento múltiplo de sequências com A-Star paralelo em cluster MPIinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesis2017-01-18T13:47:49Z2017-01-18T13:47:49Z2016-08-08info:eu-repo/semantics/openAccessporreponame:Biblioteca Digital de Monografias da UnBinstname:Universidade de Brasília (UnB)instacron:UNBORIGINAL2016_GabrielDeCFerreira_tcc.pdf2016_GabrielDeCFerreira_tcc.pdfapplication/pdf1955137http://bdm.unb.br/xmlui/bitstream/10483/15790/1/2016_GabrielDeCFerreira_tcc.pdfa5cc4600f5b8cd85d6f29cd4fbaee996MD51LICENSElicense.txtlicense.txttext/plain1758http://bdm.unb.br/xmlui/bitstream/10483/15790/5/license.txt48fee5d355e169b5219b5efc5a9ad174MD55CC-LICENSElicense_urllicense_urltext/plain49http://bdm.unb.br/xmlui/bitstream/10483/15790/2/license_url4afdbb8c545fd630ea7db775da747b2fMD52license_textlicense_textapplication/octet-stream0http://bdm.unb.br/xmlui/bitstream/10483/15790/3/license_textd41d8cd98f00b204e9800998ecf8427eMD53license_rdflicense_rdfapplication/octet-stream0http://bdm.unb.br/xmlui/bitstream/10483/15790/4/license_rdfd41d8cd98f00b204e9800998ecf8427eMD5410483/157902017-06-22 14:05:34.151oai:bdm.unb.br:10483/15790w4kgbmVjZXNzw6FyaW8gY29uY29yZGFyIGNvbSBhIGxpY2Vuw6dhIGRlIGRpc3RyaWJ1acOnw6NvIG7Do28tZXhjbHVzaXZhLAphbnRlcyBxdWUgbyBkb2N1bWVudG8gcG9zc2EgYXBhcmVjZXIgbm8gUmVwb3NpdMOzcmlvLiBQb3IgZmF2b3IsIGxlaWEgYQpsaWNlbsOnYSBhdGVudGFtZW50ZS4gQ2FzbyBuZWNlc3NpdGUgZGUgYWxndW0gZXNjbGFyZWNpbWVudG8gZW50cmUgZW0KY29udGF0byBhdHJhdsOpcyBkZTogYmRtQGJjZS51bmIuYnIgb3UgMzEwNy0yNjg3LgoKTElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEKCkFvIGFzc2luYXIgZSBlbnRyZWdhciBlc3RhIGxpY2Vuw6dhLCBvL2EgU3IuL1NyYS4gKGF1dG9yIG91IGRldGVudG9yIGRvcwpkaXJlaXRvcyBkZSBhdXRvcik6CgphKSBDb25jZWRlIMOgIFVuaXZlcnNpZGFkZSBkZSBCcmFzw61saWEgbyBkaXJlaXRvIG7Do28tZXhjbHVzaXZvIGRlCnJlcHJvZHV6aXIsIGNvbnZlcnRlciAoY29tbyBkZWZpbmlkbyBhYmFpeG8pLCBjb211bmljYXIgZS9vdQpkaXN0cmlidWlyIG8gZG9jdW1lbnRvIGVudHJlZ3VlIChpbmNsdWluZG8gbyByZXN1bW8vYWJzdHJhY3QpIGVtCmZvcm1hdG8gZGlnaXRhbCBvdSBpbXByZXNzbyBlIGVtIHF1YWxxdWVyIG1laW8uCgpiKSBEZWNsYXJhIHF1ZSBvIGRvY3VtZW50byBlbnRyZWd1ZSDDqSBzZXUgdHJhYmFsaG8gb3JpZ2luYWwsIGUgcXVlCmRldMOpbSBvIGRpcmVpdG8gZGUgY29uY2VkZXIgb3MgZGlyZWl0b3MgY29udGlkb3MgbmVzdGEgbGljZW7Dp2EuIERlY2xhcmEKdGFtYsOpbSBxdWUgYSBlbnRyZWdhIGRvIGRvY3VtZW50byBuw6NvIGluZnJpbmdlLCB0YW50byBxdWFudG8gbGhlIMOpCnBvc3PDrXZlbCBzYWJlciwgb3MgZGlyZWl0b3MgZGUgcXVhbHF1ZXIgb3V0cmEgcGVzc29hIG91IGVudGlkYWRlLgoKYykgU2UgbyBkb2N1bWVudG8gZW50cmVndWUgY29udMOpbSBtYXRlcmlhbCBkbyBxdWFsIG7Do28gZGV0w6ltIG9zCmRpcmVpdG9zIGRlIGF1dG9yLCBkZWNsYXJhIHF1ZSBvYnRldmUgYXV0b3JpemHDp8OjbyBkbyBkZXRlbnRvciBkb3MKZGlyZWl0b3MgZGUgYXV0b3IgcGFyYSBjb25jZWRlciDDoCBVbml2ZXJzaWRhZGUgZGUgQnJhc8OtbGlhIG9zIGRpcmVpdG9zCnJlcXVlcmlkb3MgcG9yIGVzdGEgbGljZW7Dp2EsIGUgcXVlIGVzc2UgbWF0ZXJpYWwgY3Vqb3MgZGlyZWl0b3Mgc8OjbyBkZQp0ZXJjZWlyb3MgZXN0w6EgY2xhcmFtZW50ZSBpZGVudGlmaWNhZG8gZSByZWNvbmhlY2lkbyBubyB0ZXh0byBvdQpjb250ZcO6ZG8gZG8gZG9jdW1lbnRvIGVudHJlZ3VlLgoKU2UgbyBkb2N1bWVudG8gZW50cmVndWUgw6kgYmFzZWFkbyBlbSB0cmFiYWxobyBmaW5hbmNpYWRvIG91IGFwb2lhZG8KcG9yIG91dHJhIGluc3RpdHVpw6fDo28gcXVlIG7Do28gYSBVbml2ZXJzaWRhZGUgZGUgQnJhc8OtbGlhLCBkZWNsYXJhIHF1ZQpjdW1wcml1IHF1YWlzcXVlciBvYnJpZ2HDp8O1ZXMgZXhpZ2lkYXMgcGVsbyByZXNwZWN0aXZvIGNvbnRyYXRvIG91CmFjb3Jkby4KCkEgVW5pdmVyc2lkYWRlIGRlIEJyYXPDrWxpYSBpZGVudGlmaWNhcsOhIGNsYXJhbWVudGUgbyhzKSBzZXUgKHMpIG5vbWUgKHMpCmNvbW8gbyAocykgYXV0b3IgKGVzKSBvdSBkZXRlbnRvciAoZXMpIGRvcyBkaXJlaXRvcyBkbyBkb2N1bWVudG8KZW50cmVndWUsIGUgbsOjbyBmYXLDoSBxdWFscXVlciBhbHRlcmHDp8OjbywgcGFyYSBhbMOpbSBkYXMgcGVybWl0aWRhcyBwb3IKZXN0YSBsaWNlbsOnYS4KBiblioteca Digital de Monografiahttps://bdm.unb.br/PUBhttp://bdm.unb.br/oai/requestbdm@bce.unb.br||patricia@bce.unb.bropendoar:115712017-06-22T17:05:34Biblioteca Digital de Monografias da UnB - Universidade de Brasília (UnB)false
dc.title.pt_BR.fl_str_mv Alinhamento múltiplo de sequências com A-Star paralelo em cluster MPI
title Alinhamento múltiplo de sequências com A-Star paralelo em cluster MPI
spellingShingle Alinhamento múltiplo de sequências com A-Star paralelo em cluster MPI
Ferreira, Gabriel de C.
Alinhamento Múltiplo de Sequências (MSA)
Algoritmos de computador
Processamento paralelo (Computadores)
title_short Alinhamento múltiplo de sequências com A-Star paralelo em cluster MPI
title_full Alinhamento múltiplo de sequências com A-Star paralelo em cluster MPI
title_fullStr Alinhamento múltiplo de sequências com A-Star paralelo em cluster MPI
title_full_unstemmed Alinhamento múltiplo de sequências com A-Star paralelo em cluster MPI
title_sort Alinhamento múltiplo de sequências com A-Star paralelo em cluster MPI
author Ferreira, Gabriel de C.
author_facet Ferreira, Gabriel de C.
author_role author
dc.contributor.author.fl_str_mv Ferreira, Gabriel de C.
dc.contributor.advisor1.fl_str_mv Melo, Alba Cristina Magalhães Alves de
contributor_str_mv Melo, Alba Cristina Magalhães Alves de
dc.subject.keyword.pt_BR.fl_str_mv Alinhamento Múltiplo de Sequências (MSA)
Algoritmos de computador
Processamento paralelo (Computadores)
topic Alinhamento Múltiplo de Sequências (MSA)
Algoritmos de computador
Processamento paralelo (Computadores)
description Trabalho de conclusão de curso (graduação)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2016.
publishDate 2016
dc.date.submitted.none.fl_str_mv 2016-08-08
dc.date.accessioned.fl_str_mv 2017-01-18T13:47:49Z
dc.date.available.fl_str_mv 2017-01-18T13:47:49Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv FERREIRA, Gabriel de C. Alinhamento múltiplo de sequências com A-Star paralelo em cluster MPI. 2016. xi, 75 f., il. Trabalho de conclusão de curso (Bacharelado em Ciência da Computação)—Universidade de Brasília, Brasília, 2016.
dc.identifier.uri.fl_str_mv http://bdm.unb.br/handle/10483/15790
identifier_str_mv FERREIRA, Gabriel de C. Alinhamento múltiplo de sequências com A-Star paralelo em cluster MPI. 2016. xi, 75 f., il. Trabalho de conclusão de curso (Bacharelado em Ciência da Computação)—Universidade de Brasília, Brasília, 2016.
url http://bdm.unb.br/handle/10483/15790
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Monografias da UnB
instname:Universidade de Brasília (UnB)
instacron:UNB
instname_str Universidade de Brasília (UnB)
instacron_str UNB
institution UNB
reponame_str Biblioteca Digital de Monografias da UnB
collection Biblioteca Digital de Monografias da UnB
bitstream.url.fl_str_mv http://bdm.unb.br/xmlui/bitstream/10483/15790/1/2016_GabrielDeCFerreira_tcc.pdf
http://bdm.unb.br/xmlui/bitstream/10483/15790/5/license.txt
http://bdm.unb.br/xmlui/bitstream/10483/15790/2/license_url
http://bdm.unb.br/xmlui/bitstream/10483/15790/3/license_text
http://bdm.unb.br/xmlui/bitstream/10483/15790/4/license_rdf
bitstream.checksum.fl_str_mv a5cc4600f5b8cd85d6f29cd4fbaee996
48fee5d355e169b5219b5efc5a9ad174
4afdbb8c545fd630ea7db775da747b2f
d41d8cd98f00b204e9800998ecf8427e
d41d8cd98f00b204e9800998ecf8427e
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Monografias da UnB - Universidade de Brasília (UnB)
repository.mail.fl_str_mv bdm@bce.unb.br||patricia@bce.unb.br
_version_ 1813907898361708544