MASA-SSE : comparação de sequências biológicas utilizando instruções vetoriais

Detalhes bibliográficos
Autor(a) principal: Ferreira, Phillipe G.
Data de Publicação: 2015
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Biblioteca Digital de Monografias da UnB
Texto Completo: http://bdm.unb.br/handle/10483/13212
Resumo: Monografia (graduação)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2015.
id UNB-2_00fdbe01dc0c6327b12c2522632f3f8e
oai_identifier_str oai:bdm.unb.br:10483/13212
network_acronym_str UNB-2
network_name_str Biblioteca Digital de Monografias da UnB
repository_id_str 11571
spelling Ferreira, Phillipe G.Melo, Alba Cristina Magalhães Alves deFERREIRA, Phillipe G. MASA-SSE: comparação de sequências biológicas utilizando instruções vetoriais. 2015. xi, 37 f., il. Monografia (Bacharelado em Engenharia da Computação)—Universidade de Brasília, Brasília, 2015.http://bdm.unb.br/handle/10483/13212Monografia (graduação)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2015.A comparação de sequências biológicas é uma das operações mais básicas e importantes da Bioinformática. Os métodos exatos de comparação de sequências possuem complexidade quadrática de tempo e por isso soluções paralelas são utilizadas para acelerar a produção de resultados. O framework MASA [3] é uma solução paralela flexível e customizável que permite o alinhamento de sequências biológicas em diferentes hardwares e softwares. Ele foi inicialmente pensado para execução paralela da comparação de sequências em GPUs (Graphics Processing Units), porém, atualmente existem duas soluções MASA para CPU: MASA-CPU e MASA-OpenMP. Essas soluções não utilizam instruções vetoriais, deixando de explorar um grande potencial para paralelismo. O presente trabalho de graduação propõe e avalia o MASA-SSE, uma solução em CPU que utiliza as instruções vetoriais SSE da Intel, implementando o algoritmo de Farrar [6], que é considerado o estado da arte em comparação de sequências biológicas com instruções vetoriais. Os resultados obtidos a partir da comparação de várias sequências reais de DNA em duas máquinas distintas mostram que o MASA-SSE, executando em uma thread e, utilizando instruções vetoriais, possui desempenho superior ao do MASA-OpenMP com quatro threads. _____________________________________________________________________________ ABSTRACTBiological sequence comparison is one of the most basic and important operations in Bioinformatics. The exact methods that compare two biological sequences have quadratic time complexity and, for this reason, parallel solutions are often used to accelerate the execution. The MASA framework [3] is a flexible and customizable parallel solution for biological sequence comparison which was initially designed for GPU (Graphics Processing Unit) execution but nowadays integrates two CPU solutions: MASA-CPU and MASA-OpenMP. These CPU solutions do not use vector instructions and thus miss the opportunity of exploring a high potential for parallelism. This graduation project proposes and evaluates MASA-SSE, a CPU solution that uses the SSE vector instructions from Intel and implements the Farrar algorithm [6], which is the state-of-the-art algorithm for biological sequence comparison with vector instructions. Experimental results obtained with the comparison of real DNA sequences in two different machines show that MASA-SSE, executing with one thread and vector instructions, outperforms MASA-OpemMP, execution with four threads.Submitted by Nayara Silva (nayarasilva@bce.unb.br) on 2016-05-19T21:16:39Z No. of bitstreams: 1 2015_PhillipeG.Ferreira.pdf: 2040617 bytes, checksum: 1d4a30eead3babb207194f9115c4e503 (MD5)Approved for entry into archive by Luanna Maia(luanna@bce.unb.br) on 2016-05-30T13:46:05Z (GMT) No. of bitstreams: 1 2015_PhillipeG.Ferreira.pdf: 2040617 bytes, checksum: 1d4a30eead3babb207194f9115c4e503 (MD5)Made available in DSpace on 2016-05-30T13:46:05Z (GMT). No. of bitstreams: 1 2015_PhillipeG.Ferreira.pdf: 2040617 bytes, checksum: 1d4a30eead3babb207194f9115c4e503 (MD5)Biologia computacionalProgramação paralela (Computação)MASA-SSE : comparação de sequências biológicas utilizando instruções vetoriaisinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesis2016-05-30T13:46:05Z2016-05-30T13:46:05Z2016-05-30T13:46:05Z2015-12-01info:eu-repo/semantics/openAccessporreponame:Biblioteca Digital de Monografias da UnBinstname:Universidade de Brasília (UnB)instacron:UNBORIGINAL2015_PhillipeG.Ferreira.pdf2015_PhillipeG.Ferreira.pdfapplication/pdf2040617http://bdm.unb.br/xmlui/bitstream/10483/13212/1/2015_PhillipeG.Ferreira.pdf1d4a30eead3babb207194f9115c4e503MD51CC-LICENSElicense_urllicense_urltext/plain49http://bdm.unb.br/xmlui/bitstream/10483/13212/2/license_url4afdbb8c545fd630ea7db775da747b2fMD52license_textlicense_textapplication/octet-stream0http://bdm.unb.br/xmlui/bitstream/10483/13212/3/license_textd41d8cd98f00b204e9800998ecf8427eMD53license_rdflicense_rdfapplication/octet-stream23148http://bdm.unb.br/xmlui/bitstream/10483/13212/4/license_rdf9da0b6dfac957114c6a7714714b86306MD54LICENSElicense.txtlicense.txttext/plain1847http://bdm.unb.br/xmlui/bitstream/10483/13212/5/license.txt01c7dcbcb06ceb460721eabca1df87a6MD5510483/132122016-05-30 10:46:05.914oai:bdm.unb.br:10483/13212TGljZW5zZSBncmFudGVkIGJ5IE5heWFyYSBTaWx2YSAobmF5YXJhc2lsdmFAYmNlLnVuYi5icikgb24gMjAxNi0wNS0xOVQyMToxNjozOVogKEdNVCk6CgrDiSBuZWNlc3PDoXJpbyBjb25jb3JkYXIgY29tIGEgbGljZW7Dp2EgZGUgZGlzdHJpYnVpw6fDo28gbsOjby1leGNsdXNpdmEsCmFudGVzIHF1ZSBvIGRvY3VtZW50byBwb3NzYSBhcGFyZWNlciBubyBSZXBvc2l0w7NyaW8uIFBvciBmYXZvciwgbGVpYSBhCmxpY2Vuw6dhIGF0ZW50YW1lbnRlLiBDYXNvIG5lY2Vzc2l0ZSBkZSBhbGd1bSBlc2NsYXJlY2ltZW50byBlbnRyZSBlbQpjb250YXRvIGF0cmF2w6lzIGRlOiBiZG1AYmNlLnVuYi5iciBvdSAzMTA3LTI2ODcuCgpMSUNFTsOHQSBERSBESVNUUklCVUnDh8ODTyBOw4NPLUVYQ0xVU0lWQQoKQW8gYXNzaW5hciBlIGVudHJlZ2FyIGVzdGEgbGljZW7Dp2EsIG8vYSBTci4vU3JhLiAoYXV0b3Igb3UgZGV0ZW50b3IgZG9zCmRpcmVpdG9zIGRlIGF1dG9yKToKCmEpIENvbmNlZGUgw6AgVW5pdmVyc2lkYWRlIGRlIEJyYXPDrWxpYSBvIGRpcmVpdG8gbsOjby1leGNsdXNpdm8gZGUKcmVwcm9kdXppciwgY29udmVydGVyIChjb21vIGRlZmluaWRvIGFiYWl4byksIGNvbXVuaWNhciBlL291CmRpc3RyaWJ1aXIgbyBkb2N1bWVudG8gZW50cmVndWUgKGluY2x1aW5kbyBvIHJlc3Vtby9hYnN0cmFjdCkgZW0KZm9ybWF0byBkaWdpdGFsIG91IGltcHJlc3NvIGUgZW0gcXVhbHF1ZXIgbWVpby4KCmIpIERlY2xhcmEgcXVlIG8gZG9jdW1lbnRvIGVudHJlZ3VlIMOpIHNldSB0cmFiYWxobyBvcmlnaW5hbCwgZSBxdWUKZGV0w6ltIG8gZGlyZWl0byBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4gRGVjbGFyYQp0YW1iw6ltIHF1ZSBhIGVudHJlZ2EgZG8gZG9jdW1lbnRvIG7Do28gaW5mcmluZ2UsIHRhbnRvIHF1YW50byBsaGUgw6kKcG9zc8OtdmVsIHNhYmVyLCBvcyBkaXJlaXRvcyBkZSBxdWFscXVlciBvdXRyYSBwZXNzb2Egb3UgZW50aWRhZGUuCgpjKSBTZSBvIGRvY3VtZW50byBlbnRyZWd1ZSBjb250w6ltIG1hdGVyaWFsIGRvIHF1YWwgbsOjbyBkZXTDqW0gb3MKZGlyZWl0b3MgZGUgYXV0b3IsIGRlY2xhcmEgcXVlIG9idGV2ZSBhdXRvcml6YcOnw6NvIGRvIGRldGVudG9yIGRvcwpkaXJlaXRvcyBkZSBhdXRvciBwYXJhIGNvbmNlZGVyIMOgIFVuaXZlcnNpZGFkZSBkZSBCcmFzw61saWEgb3MgZGlyZWl0b3MKcmVxdWVyaWRvcyBwb3IgZXN0YSBsaWNlbsOnYSwgZSBxdWUgZXNzZSBtYXRlcmlhbCBjdWpvcyBkaXJlaXRvcyBzw6NvIGRlCnRlcmNlaXJvcyBlc3TDoSBjbGFyYW1lbnRlIGlkZW50aWZpY2FkbyBlIHJlY29uaGVjaWRvIG5vIHRleHRvIG91CmNvbnRlw7pkbyBkbyBkb2N1bWVudG8gZW50cmVndWUuCgpTZSBvIGRvY3VtZW50byBlbnRyZWd1ZSDDqSBiYXNlYWRvIGVtIHRyYWJhbGhvIGZpbmFuY2lhZG8gb3UgYXBvaWFkbwpwb3Igb3V0cmEgaW5zdGl0dWnDp8OjbyBxdWUgbsOjbyBhIFVuaXZlcnNpZGFkZSBkZSBCcmFzw61saWEsIGRlY2xhcmEgcXVlCmN1bXByaXUgcXVhaXNxdWVyIG9icmlnYcOnw7VlcyBleGlnaWRhcyBwZWxvIHJlc3BlY3Rpdm8gY29udHJhdG8gb3UKYWNvcmRvLgoKQSBVbml2ZXJzaWRhZGUgZGUgQnJhc8OtbGlhIGlkZW50aWZpY2Fyw6EgY2xhcmFtZW50ZSBvKHMpIHNldSAocykgbm9tZSAocykKY29tbyBvIChzKSBhdXRvciAoZXMpIG91IGRldGVudG9yIChlcykgZG9zIGRpcmVpdG9zIGRvIGRvY3VtZW50bwplbnRyZWd1ZSwgZSBuw6NvIGZhcsOhIHF1YWxxdWVyIGFsdGVyYcOnw6NvLCBwYXJhIGFsw6ltIGRhcyBwZXJtaXRpZGFzIHBvcgplc3RhIGxpY2Vuw6dhLgo=Biblioteca Digital de Monografiahttps://bdm.unb.br/PUBhttp://bdm.unb.br/oai/requestbdm@bce.unb.br||patricia@bce.unb.bropendoar:115712016-05-30T13:46:05Biblioteca Digital de Monografias da UnB - Universidade de Brasília (UnB)false
dc.title.en.fl_str_mv MASA-SSE : comparação de sequências biológicas utilizando instruções vetoriais
title MASA-SSE : comparação de sequências biológicas utilizando instruções vetoriais
spellingShingle MASA-SSE : comparação de sequências biológicas utilizando instruções vetoriais
Ferreira, Phillipe G.
Biologia computacional
Programação paralela (Computação)
title_short MASA-SSE : comparação de sequências biológicas utilizando instruções vetoriais
title_full MASA-SSE : comparação de sequências biológicas utilizando instruções vetoriais
title_fullStr MASA-SSE : comparação de sequências biológicas utilizando instruções vetoriais
title_full_unstemmed MASA-SSE : comparação de sequências biológicas utilizando instruções vetoriais
title_sort MASA-SSE : comparação de sequências biológicas utilizando instruções vetoriais
author Ferreira, Phillipe G.
author_facet Ferreira, Phillipe G.
author_role author
dc.contributor.author.fl_str_mv Ferreira, Phillipe G.
dc.contributor.advisor1.fl_str_mv Melo, Alba Cristina Magalhães Alves de
contributor_str_mv Melo, Alba Cristina Magalhães Alves de
dc.subject.keyword.en.fl_str_mv Biologia computacional
Programação paralela (Computação)
topic Biologia computacional
Programação paralela (Computação)
description Monografia (graduação)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2015.
publishDate 2015
dc.date.submitted.none.fl_str_mv 2015-12-01
dc.date.accessioned.fl_str_mv 2016-05-30T13:46:05Z
dc.date.available.fl_str_mv 2016-05-30T13:46:05Z
dc.date.issued.fl_str_mv 2016-05-30T13:46:05Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv FERREIRA, Phillipe G. MASA-SSE: comparação de sequências biológicas utilizando instruções vetoriais. 2015. xi, 37 f., il. Monografia (Bacharelado em Engenharia da Computação)—Universidade de Brasília, Brasília, 2015.
dc.identifier.uri.fl_str_mv http://bdm.unb.br/handle/10483/13212
identifier_str_mv FERREIRA, Phillipe G. MASA-SSE: comparação de sequências biológicas utilizando instruções vetoriais. 2015. xi, 37 f., il. Monografia (Bacharelado em Engenharia da Computação)—Universidade de Brasília, Brasília, 2015.
url http://bdm.unb.br/handle/10483/13212
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Monografias da UnB
instname:Universidade de Brasília (UnB)
instacron:UNB
instname_str Universidade de Brasília (UnB)
instacron_str UNB
institution UNB
reponame_str Biblioteca Digital de Monografias da UnB
collection Biblioteca Digital de Monografias da UnB
bitstream.url.fl_str_mv http://bdm.unb.br/xmlui/bitstream/10483/13212/1/2015_PhillipeG.Ferreira.pdf
http://bdm.unb.br/xmlui/bitstream/10483/13212/2/license_url
http://bdm.unb.br/xmlui/bitstream/10483/13212/3/license_text
http://bdm.unb.br/xmlui/bitstream/10483/13212/4/license_rdf
http://bdm.unb.br/xmlui/bitstream/10483/13212/5/license.txt
bitstream.checksum.fl_str_mv 1d4a30eead3babb207194f9115c4e503
4afdbb8c545fd630ea7db775da747b2f
d41d8cd98f00b204e9800998ecf8427e
9da0b6dfac957114c6a7714714b86306
01c7dcbcb06ceb460721eabca1df87a6
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Monografias da UnB - Universidade de Brasília (UnB)
repository.mail.fl_str_mv bdm@bce.unb.br||patricia@bce.unb.br
_version_ 1801492993282146304