Comparação de sequências biológicas longas em FPGA usando particionamento

Detalhes bibliográficos
Autor(a) principal: Silveira, Andressa Sousa da
Data de Publicação: 2017
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Biblioteca Digital de Monografias da UnB
Texto Completo: http://bdm.unb.br/handle/10483/17768
Resumo: Trabalho de conclusão de curso (graduação)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2017.
id UNB-2_84662f40a42d5515456f207b5303cdf3
oai_identifier_str oai:bdm.unb.br:10483/17768
network_acronym_str UNB-2
network_name_str Biblioteca Digital de Monografias da UnB
repository_id_str 11571
spelling Silveira, Andressa Sousa daMelo, Alba Cristina Magalhães Alves deSILVEIRA, Andressa Sousa da. Comparação de sequências biológicas longas em FPGA usando particionamento. 2017. xii, 50 f., il. Trabalho de conclusão de curso (Bacharelado em Engenharia da Computação)—Universidade de Brasília, Brasília, 2017.http://bdm.unb.br/handle/10483/17768Trabalho de conclusão de curso (graduação)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2017.Uma importante operação da Bioinformática é a comparação de sequências biológicas, que tem como resultado o escore ótimo determinando o grau de similaridade entre duas sequências. O escore ótimo é obtido por meio de algoritmos exatos que calculam uma matriz de programação dinâmica, possuindo complexidade quadrática O(mn), onde m e n são os tamanhos das sequências. As soluções em FPGA para a comparação de sequências biológicas atingiram altíssimo desempenho, porém essas soluções exigem que poucos milhares de caracteres das sequências sejam comparados a cada vez, ou seja, a comparação deve ser particionada. O objetivo do presente trabalho de graduação é propor, implementar e avaliar uma solução em FPGA para a comparação exata de sequências biológicas com particionamento. Foram propostos dois circuitos de particionamento (v.1 e v.2), onde o circuito v.1 recebe a coluna, linha e diagonal intermediárias da matriz de programação dinâmica, calcula uma parte da matriz e produz o escore. O circuito v.2, da mesma maneira, recebe a coluna, linha e diagonal intermediárias da matriz de programação dinâmica, calcula uma parte da matriz e produz o escore, linha, coluna e diagonal finais da partição da matriz que foi calculada. Os resultados experimentais mostram uma boa ocupação do FPGA com elementos de processamento. Além disso, a execução do circuito de particionamento v.1 na plataforma XD2000i para a comparação de sequências biológicas de 20 caracteres cada apresenta tempos bastante satisfatórios (até 948μs).Submitted by Raiane Costa da Silva (raianesilva@bce.unb.br) on 2017-05-23T19:09:22Z No. of bitstreams: 3 license_text: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) 2017_AndressaSousaDaSilveira_tcc.pdf: 3933262 bytes, checksum: 08f298aeec83494d23b255e2df9baf10 (MD5)Approved for entry into archive by Ruthlea Nascimento (ruthlea.nascimento@gmail.com) on 2017-08-08T11:51:13Z (GMT) No. of bitstreams: 3 license_text: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) 2017_AndressaSousaDaSilveira_tcc.pdf: 3933262 bytes, checksum: 08f298aeec83494d23b255e2df9baf10 (MD5)Made available in DSpace on 2017-08-08T11:51:13Z (GMT). No. of bitstreams: 3 license_text: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) 2017_AndressaSousaDaSilveira_tcc.pdf: 3933262 bytes, checksum: 08f298aeec83494d23b255e2df9baf10 (MD5)An important operation in Bioinformatics is the biological sequence comparison, which has as result the best score that determines how similar are two sequences. The best score is obtained with the computation of the dynamic programming matrix by exact algorithms, whose complexities are O(mn), where m and n are the size of the sequences. Solutions in FPGA for biological sequence comparison reached great performances, however these solutions require a few thousand characters of the sequences being compared at a time, in other words, the comparison must be partitioned. The objective of this graduation work is to propose, implement and evaluate a solution in FPGA for the biological sequence comparison with partitioning. Two partitioning circuits (v.1 and v.2) were proposed, where circuit v.1 receives the intermediate column, row and diagonal from the dynamic programming matrix, computes a part of the matrix and produces the score. In the same way, the circuit v.2 receives the intermediate column, row and diagonal from the dynamic programming matrix, computes a part of the matrix and produces the score, last column, row and diagonal of the computed partition of the matrix. The experimental results show a great occupation of the FPGA with processing elements. Besides, the execution of the partitioning circuit v.1 in the XtremeData XD2000iTM for the biological sequence comparison with both sequences having 20 characters present very satisfactory times (up to 948μs).BioinformáticaFPGAs (Field Programmable Gate Arrays)Comparação de sequências biológicas longas em FPGA usando particionamentoinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesis2017-08-08T11:51:13Z2017-08-08T11:51:13Z2017-02-03info:eu-repo/semantics/openAccessporreponame:Biblioteca Digital de Monografias da UnBinstname:Universidade de Brasília (UnB)instacron:UNBCC-LICENSElicense_urllicense_urltext/plain49http://bdm.unb.br/xmlui/bitstream/10483/17768/2/license_url4afdbb8c545fd630ea7db775da747b2fMD52license_textlicense_textapplication/octet-stream0http://bdm.unb.br/xmlui/bitstream/10483/17768/3/license_textd41d8cd98f00b204e9800998ecf8427eMD53license_rdflicense_rdfapplication/octet-stream0http://bdm.unb.br/xmlui/bitstream/10483/17768/4/license_rdfd41d8cd98f00b204e9800998ecf8427eMD54LICENSElicense.txtlicense.txttext/plain1817http://bdm.unb.br/xmlui/bitstream/10483/17768/5/license.txt21554873e56ad8ddc69c092699b98f95MD55ORIGINAL2017_AndressaSousaDaSilveira_tcc.pdf2017_AndressaSousaDaSilveira_tcc.pdfapplication/pdf3933262http://bdm.unb.br/xmlui/bitstream/10483/17768/1/2017_AndressaSousaDaSilveira_tcc.pdf08f298aeec83494d23b255e2df9baf10MD5110483/177682017-08-08 08:51:13.701oai:bdm.unb.br:10483/17768w4kgbmVjZXNzw6FyaW8gY29uY29yZGFyIGNvbSBhIGxpY2Vuw6dhIGRlIGRpc3RyaWJ1acOnw6NvIG7Do28tZXhjbHVzaXZhLAphbnRlcyBxdWUgbyBkb2N1bWVudG8gcG9zc2EgYXBhcmVjZXIgbmEgQmlibGlvdGVjYSBEaWdpdGFsIGRhIFByb2R1w6fDo28gCkRpc2NlbnRlIGRhIFVuaXZlcnNpZGFkZSBkZSBCcmFzw61saWEuIFBvciBmYXZvciwgbGVpYSBhCmxpY2Vuw6dhIGF0ZW50YW1lbnRlLiBDYXNvIG5lY2Vzc2l0ZSBkZSBhbGd1bSBlc2NsYXJlY2ltZW50byBlbnRyZSBlbQpjb250YXRvIGF0cmF2w6lzIGRlOiBiZG1AYmNlLnVuYi5iciBvdSAzMTA3LTI2ODcuCgpMSUNFTsOHQSBERSBESVNUUklCVUnDh8ODTyBOw4NPLUVYQ0xVU0lWQQoKQW8gYXNzaW5hciBlIGVudHJlZ2FyIGVzdGEgbGljZW7Dp2EsIG8vYSBTci4vU3JhLiAoYXV0b3Igb3UgZGV0ZW50b3IgZG9zCmRpcmVpdG9zIGRlIGF1dG9yKToKCmEpIENvbmNlZGUgw6AgVW5pdmVyc2lkYWRlIGRlIEJyYXPDrWxpYSBvIGRpcmVpdG8gbsOjby1leGNsdXNpdm8gZGUKcmVwcm9kdXppciwgY29udmVydGVyIChjb21vIGRlZmluaWRvIGFiYWl4byksIGNvbXVuaWNhciBlL291CmRpc3RyaWJ1aXIgbyBkb2N1bWVudG8gZW50cmVndWUgKGluY2x1aW5kbyBvIHJlc3Vtby9hYnN0cmFjdCkgZW0KZm9ybWF0byBkaWdpdGFsIG91IGltcHJlc3NvIGUgZW0gcXVhbHF1ZXIgbWVpby4KCmIpIERlY2xhcmEgcXVlIG8gZG9jdW1lbnRvIGVudHJlZ3VlIMOpIHNldSB0cmFiYWxobyBvcmlnaW5hbCwgZSBxdWUKZGV0w6ltIG8gZGlyZWl0byBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4gRGVjbGFyYQp0YW1iw6ltIHF1ZSBhIGVudHJlZ2EgZG8gZG9jdW1lbnRvIG7Do28gaW5mcmluZ2UsIHRhbnRvIHF1YW50byBsaGUgw6kKcG9zc8OtdmVsIHNhYmVyLCBvcyBkaXJlaXRvcyBkZSBxdWFscXVlciBvdXRyYSBwZXNzb2Egb3UgZW50aWRhZGUuCgpjKSBTZSBvIGRvY3VtZW50byBlbnRyZWd1ZSBjb250w6ltIG1hdGVyaWFsIGRvIHF1YWwgbsOjbyBkZXTDqW0gb3MKZGlyZWl0b3MgZGUgYXV0b3IsIGRlY2xhcmEgcXVlIG9idGV2ZSBhdXRvcml6YcOnw6NvIGRvIGRldGVudG9yIGRvcwpkaXJlaXRvcyBkZSBhdXRvciBwYXJhIGNvbmNlZGVyIMOgIFVuaXZlcnNpZGFkZSBkZSBCcmFzw61saWEgb3MgZGlyZWl0b3MKcmVxdWVyaWRvcyBwb3IgZXN0YSBsaWNlbsOnYSwgZSBxdWUgZXNzZSBtYXRlcmlhbCBjdWpvcyBkaXJlaXRvcyBzw6NvIGRlCnRlcmNlaXJvcyBlc3TDoSBjbGFyYW1lbnRlIGlkZW50aWZpY2FkbyBlIHJlY29uaGVjaWRvIG5vIHRleHRvIG91CmNvbnRlw7pkbyBkbyBkb2N1bWVudG8gZW50cmVndWUuCgpTZSBvIGRvY3VtZW50byBlbnRyZWd1ZSDDqSBiYXNlYWRvIGVtIHRyYWJhbGhvIGZpbmFuY2lhZG8gb3UgYXBvaWFkbwpwb3Igb3V0cmEgaW5zdGl0dWnDp8OjbyBxdWUgbsOjbyBhIFVuaXZlcnNpZGFkZSBkZSBCcmFzw61saWEsIGRlY2xhcmEgcXVlCmN1bXByaXUgcXVhaXNxdWVyIG9icmlnYcOnw7VlcyBleGlnaWRhcyBwZWxvIHJlc3BlY3Rpdm8gY29udHJhdG8gb3UKYWNvcmRvLgoKQSBVbml2ZXJzaWRhZGUgZGUgQnJhc8OtbGlhIGlkZW50aWZpY2Fyw6EgY2xhcmFtZW50ZSBvKHMpIHNldSAocykgbm9tZSAocykKY29tbyBvIChzKSBhdXRvciAoZXMpIG91IGRldGVudG9yIChlcykgZG9zIGRpcmVpdG9zIGRvIGRvY3VtZW50bwplbnRyZWd1ZSwgZSBuw6NvIGZhcsOhIHF1YWxxdWVyIGFsdGVyYcOnw6NvLCBwYXJhIGFsw6ltIGRhcyBwZXJtaXRpZGFzIHBvcgplc3RhIGxpY2Vuw6dhLgo=Biblioteca Digital de Monografiahttps://bdm.unb.br/PUBhttp://bdm.unb.br/oai/requestbdm@bce.unb.br||patricia@bce.unb.bropendoar:115712017-08-08T11:51:13Biblioteca Digital de Monografias da UnB - Universidade de Brasília (UnB)false
dc.title.pt_BR.fl_str_mv Comparação de sequências biológicas longas em FPGA usando particionamento
title Comparação de sequências biológicas longas em FPGA usando particionamento
spellingShingle Comparação de sequências biológicas longas em FPGA usando particionamento
Silveira, Andressa Sousa da
Bioinformática
FPGAs (Field Programmable Gate Arrays)
title_short Comparação de sequências biológicas longas em FPGA usando particionamento
title_full Comparação de sequências biológicas longas em FPGA usando particionamento
title_fullStr Comparação de sequências biológicas longas em FPGA usando particionamento
title_full_unstemmed Comparação de sequências biológicas longas em FPGA usando particionamento
title_sort Comparação de sequências biológicas longas em FPGA usando particionamento
author Silveira, Andressa Sousa da
author_facet Silveira, Andressa Sousa da
author_role author
dc.contributor.author.fl_str_mv Silveira, Andressa Sousa da
dc.contributor.advisor1.fl_str_mv Melo, Alba Cristina Magalhães Alves de
contributor_str_mv Melo, Alba Cristina Magalhães Alves de
dc.subject.keyword.pt_BR.fl_str_mv Bioinformática
FPGAs (Field Programmable Gate Arrays)
topic Bioinformática
FPGAs (Field Programmable Gate Arrays)
description Trabalho de conclusão de curso (graduação)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2017.
publishDate 2017
dc.date.submitted.none.fl_str_mv 2017-02-03
dc.date.accessioned.fl_str_mv 2017-08-08T11:51:13Z
dc.date.available.fl_str_mv 2017-08-08T11:51:13Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv SILVEIRA, Andressa Sousa da. Comparação de sequências biológicas longas em FPGA usando particionamento. 2017. xii, 50 f., il. Trabalho de conclusão de curso (Bacharelado em Engenharia da Computação)—Universidade de Brasília, Brasília, 2017.
dc.identifier.uri.fl_str_mv http://bdm.unb.br/handle/10483/17768
identifier_str_mv SILVEIRA, Andressa Sousa da. Comparação de sequências biológicas longas em FPGA usando particionamento. 2017. xii, 50 f., il. Trabalho de conclusão de curso (Bacharelado em Engenharia da Computação)—Universidade de Brasília, Brasília, 2017.
url http://bdm.unb.br/handle/10483/17768
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Monografias da UnB
instname:Universidade de Brasília (UnB)
instacron:UNB
instname_str Universidade de Brasília (UnB)
instacron_str UNB
institution UNB
reponame_str Biblioteca Digital de Monografias da UnB
collection Biblioteca Digital de Monografias da UnB
bitstream.url.fl_str_mv http://bdm.unb.br/xmlui/bitstream/10483/17768/2/license_url
http://bdm.unb.br/xmlui/bitstream/10483/17768/3/license_text
http://bdm.unb.br/xmlui/bitstream/10483/17768/4/license_rdf
http://bdm.unb.br/xmlui/bitstream/10483/17768/5/license.txt
http://bdm.unb.br/xmlui/bitstream/10483/17768/1/2017_AndressaSousaDaSilveira_tcc.pdf
bitstream.checksum.fl_str_mv 4afdbb8c545fd630ea7db775da747b2f
d41d8cd98f00b204e9800998ecf8427e
d41d8cd98f00b204e9800998ecf8427e
21554873e56ad8ddc69c092699b98f95
08f298aeec83494d23b255e2df9baf10
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Monografias da UnB - Universidade de Brasília (UnB)
repository.mail.fl_str_mv bdm@bce.unb.br||patricia@bce.unb.br
_version_ 1798495706986577920