Comparação paralela de sequências biológicas em plataformas de hardware uniformes e híbridas

Detalhes bibliográficos
Autor(a) principal: Jorge, Carlos Antônio Campos
Data de Publicação: 2022
Tipo de documento: Tese
Idioma: por
Título da fonte: Repositório Institucional da UnB
Texto Completo: https://repositorio.unb.br/handle/10482/45443
Resumo: Tese (doutorado) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2022.
id UNB_040556a7e046096193c115ec8df23c8c
oai_identifier_str oai:repositorio2.unb.br:10482/45443
network_acronym_str UNB
network_name_str Repositório Institucional da UnB
repository_id_str
spelling Jorge, Carlos Antônio CamposMelo, Alba Cristina Magalhães Alves de2023-01-05T21:36:17Z2023-01-05T21:36:17Z2023-01-052022-04-19JORGE, Carlos Antônio Campos. Comparação paralela de sequências biológicas em plataformas de hardware uniformes e híbridas. 2022. xiii, 101 f., il. Tese (Doutorado em Informática) — Universidade de Brasília, Brasília, 2022.https://repositorio.unb.br/handle/10482/45443Tese (doutorado) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2022.O alinhamento de sequências expõe claramente os padrões mais relevantes entre duas sequências, sendo útil para descobrir informação funcional, estrutural e evolucionária em sequências biológicas. Para tanto, é necessário descobrir o alinhamento ótimo, ou seja, o padrão que maximiza a similaridade entre as sequências. O algoritmo Longest Common Subsequence (LCS) produz o alinhamento ótimo e, por isso, é muito utilizado ao redor do mundo. Devido à complexidade quadrática de tempo, sua execução pode demorar muito se as sequências comparadas forem longas. Por isso, plataformas de hardware como FPGAs (Field Programmable Gate Arrays) tem sido exploradas. Para simplificar a programação de hardware, foram propostas soluções de alto nível, como HLS (High Level Synthesis), que transforma automaticamente um programa C, C++ ou SystemC em uma especificação de hardware, simplificando a programação. Para atingir certa simplicidade da programação e, consequentemente, reduzir o tempo necessário para a obtenção do circuito, exploramos nessa Tese a programação em HLS e em C. Além disso, investigamos soluções para a execução do algoritmo LCS tanto em plataformas FPGA stand-alone como em plataformas híbridas (CPU+FPGA). Inicialmente, confeccionamos um circuito programado em HLS, que foi executado em uma plataforma FPGA stand-alone. O circuito projetado comporta até dois co-processadores, permitindo a comparação paralela de dois pares de sequências. As execuções no ambiente stand-alone de um lote de 20 comparações de sequências sintéticas de 10K, 20K e 50K mostraram que a execução em FPGA consome menos energia e que as execuções híbridas (CPU+FPGA) atingem desempenho muito bom. Adicionalmente, foi comparado um lote de 20 sequências reais do vírus SARSCoV-2 (30K) na plataforma stand-alone. Nesse caso, a configuração com 2 co-processadores, executando 2 comparações em CPU e 18 comparações em FPGA obteve bons resultados, tanto em tempo de execução como em consumo de energia. Finalmente, a solução projetada para execução híbrida (CPU+FPGA) em plataformas stand-alone foi adaptada para execução na instância f1 da nuvem AWS. Na comparação de lotes de 20 sequências de 50K na nuvem AWS, mostramos que a configuração FPGA-only com dois coprocessadores executou-se em menor tempo e consumiu menos energia do que as configurações CPU-only e híbridas.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES).Sequence alignment clearly exposes the most relevant patterns between two sequences, being useful for discovering functional, structural and evolutionary information in biological sequences. Therefore, it is necessary to find the optimal alignment, that is, the pattern that maximizes the similarity between the sequences. The Longest Common Subsequence (LCS) algorithm produces the optimal alignment and is therefore widely used around the world. Due to the quadratic complexity of time, its execution can take a long time if the compared sequences are long. Therefore, hardware platforms such as FPGAs (Field Programmable Gate Arrays) have been explored. To simplify hardware programming, high-level solutions have been proposed, such as HLS (High Level Synthesis), which automatically transforms a C, C++ or SystemC program into a hardware specification, simplifying programming. In order to achieve a certain simplicity of programming and, consequently, reduce the time needed to obtain the circuit, in this thesis we explore programming in HLS and in C. In addition, we investigate solutions for the execution of the LCS algorithm both on FPGA stand -alone as on hybrid platforms (CPU+FPGA). Initially, we made a circuit programmed in HLS, which was executed on an FPGA stand-alone platform. The designed circuit supports up to two co-processors, allowing the parallel comparison of two pairs of sequences. Executions in the stand-alone environment of a batch of 20 comparisons of 10K, 20K and 50K synthetic sequences showed that the FPGA execution consumes less power and that the hybrid executions (CPU+FPGA) achieve very good performance. Additionally, a batch of 20 real sequences of the SARS-CoV-2 virus (30K) on the stand-alone platform was compared. In this case, the configuration with 2 coprocessors, running 2 comparisons on CPU and 18 comparisons on FPGA obtained good results, both in execution time and in power consumption. Finally, the solution designed for hybrid execution (CPU+FPGA) on stand-alone platforms was adapted to run on the f1 instance of the AWS cloud. In comparing batches of 20 50K sequences in the AWS cloud, we showed that the FPGA-only configuration with two co-processors ran in less time and consumed less power than the CPU-only configurations. and hybrids.A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.bce.unb.br, www.ibict.br, http://hercules.vtls.com/cgi-bin/ndltd/chameleon?lng=pt&skin=ndltd sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data.info:eu-repo/semantics/openAccessComparação paralela de sequências biológicas em plataformas de hardware uniformes e híbridasinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisSequências biológicas - comparaçãoField Programmable Gate Arrays (FPGAs)Hardware reconfigurávelporreponame:Repositório Institucional da UnBinstname:Universidade de Brasília (UnB)instacron:UNBORIGINAL2022_CarlosAntonioCamposJorge.pdf2022_CarlosAntonioCamposJorge.pdfapplication/pdf2995290http://repositorio2.unb.br/jspui/bitstream/10482/45443/1/2022_CarlosAntonioCamposJorge.pdf471713bdff9e81b6d6ce93e16b392051MD51open accessLICENSElicense.txtlicense.txttext/plain671http://repositorio2.unb.br/jspui/bitstream/10482/45443/2/license.txtbacfee268cc5d4f6aaa2e6e0066d38f5MD52open access10482/454432023-07-10 10:00:51.241open accessoai:repositorio2.unb.br:10482/45443QSBjb25jZXNzw6NvIGRhIGxpY2Vuw6dhIGRlc3RlIGl0ZW0gcmVmZXJlLXNlIGFvIHRlcm1vIGRlIGF1dG9yaXphw6fDo28gaW1wcmVzc28gYXNzaW5hZG8gDQpwZWxvIGF1dG9yIGNvbSBhcyBzZWd1aW50ZXMgY29uZGnDp8O1ZXM6DQoNCk5hIHF1YWxpZGFkZSBkZSB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvciBkYSBwdWJsaWNhw6fDo28sIGF1dG9yaXpvIGEgVW5pdmVyc2lkYWRlIGRlIEJyYXPDrWxpYQ0KIGUgbyBJQklDVCBhIGRpc3BvbmliaWxpemFyIHBvciBtZWlvIGRvcyBzaXRlcyB3d3cuYmNlLnVuYi5iciwgd3d3LmliaWN0LmJyLA0KIGh0dHA6Ly9oZXJjdWxlcy52dGxzLmNvbS9jZ2ktYmluL25kbHRkL2NoYW1lbGVvbj9sbmc9cHQmc2tpbj1uZGx0ZCBzZW0gcmVzc2FyY2ltZW50byBkb3MgDQpkaXJlaXRvcyBhdXRvcmFpcywgZGUgYWNvcmRvIGNvbSBhIExlaSBuwrogOTYxMC85OCwgbyB0ZXh0byBpbnRlZ3JhbCBkYSBvYnJhIGRpc3BvbmliaWxpemFkYSwNCiBjb25mb3JtZSBwZXJtaXNzw7VlcyBhc3NpbmFsYWRhcywgcGFyYSBmaW5zIGRlIGxlaXR1cmEsIGltcHJlc3PDo28gZS9vdSBkb3dubG9hZCwgYSB0w610dWxvIGRlIA0KZGl2dWxnYcOnw6NvIGRhIHByb2R1w6fDo28gY2llbnTDrWZpY2EgYnJhc2lsZWlyYSwgYSBwYXJ0aXIgZGVzdGEgZGF0YS4=Biblioteca Digital de Teses e DissertaçõesPUBhttps://repositorio.unb.br/oai/requestopendoar:2023-07-10T13:00:51Repositório Institucional da UnB - Universidade de Brasília (UnB)false
dc.title.pt_BR.fl_str_mv Comparação paralela de sequências biológicas em plataformas de hardware uniformes e híbridas
title Comparação paralela de sequências biológicas em plataformas de hardware uniformes e híbridas
spellingShingle Comparação paralela de sequências biológicas em plataformas de hardware uniformes e híbridas
Jorge, Carlos Antônio Campos
Sequências biológicas - comparação
Field Programmable Gate Arrays (FPGAs)
Hardware reconfigurável
title_short Comparação paralela de sequências biológicas em plataformas de hardware uniformes e híbridas
title_full Comparação paralela de sequências biológicas em plataformas de hardware uniformes e híbridas
title_fullStr Comparação paralela de sequências biológicas em plataformas de hardware uniformes e híbridas
title_full_unstemmed Comparação paralela de sequências biológicas em plataformas de hardware uniformes e híbridas
title_sort Comparação paralela de sequências biológicas em plataformas de hardware uniformes e híbridas
author Jorge, Carlos Antônio Campos
author_facet Jorge, Carlos Antônio Campos
author_role author
dc.contributor.author.fl_str_mv Jorge, Carlos Antônio Campos
dc.contributor.advisor1.fl_str_mv Melo, Alba Cristina Magalhães Alves de
contributor_str_mv Melo, Alba Cristina Magalhães Alves de
dc.subject.keyword.pt_BR.fl_str_mv Sequências biológicas - comparação
Field Programmable Gate Arrays (FPGAs)
Hardware reconfigurável
topic Sequências biológicas - comparação
Field Programmable Gate Arrays (FPGAs)
Hardware reconfigurável
description Tese (doutorado) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2022.
publishDate 2022
dc.date.submitted.none.fl_str_mv 2022-04-19
dc.date.accessioned.fl_str_mv 2023-01-05T21:36:17Z
dc.date.available.fl_str_mv 2023-01-05T21:36:17Z
dc.date.issued.fl_str_mv 2023-01-05
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv JORGE, Carlos Antônio Campos. Comparação paralela de sequências biológicas em plataformas de hardware uniformes e híbridas. 2022. xiii, 101 f., il. Tese (Doutorado em Informática) — Universidade de Brasília, Brasília, 2022.
dc.identifier.uri.fl_str_mv https://repositorio.unb.br/handle/10482/45443
identifier_str_mv JORGE, Carlos Antônio Campos. Comparação paralela de sequências biológicas em plataformas de hardware uniformes e híbridas. 2022. xiii, 101 f., il. Tese (Doutorado em Informática) — Universidade de Brasília, Brasília, 2022.
url https://repositorio.unb.br/handle/10482/45443
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.source.none.fl_str_mv reponame:Repositório Institucional da UnB
instname:Universidade de Brasília (UnB)
instacron:UNB
instname_str Universidade de Brasília (UnB)
instacron_str UNB
institution UNB
reponame_str Repositório Institucional da UnB
collection Repositório Institucional da UnB
bitstream.url.fl_str_mv http://repositorio2.unb.br/jspui/bitstream/10482/45443/1/2022_CarlosAntonioCamposJorge.pdf
http://repositorio2.unb.br/jspui/bitstream/10482/45443/2/license.txt
bitstream.checksum.fl_str_mv 471713bdff9e81b6d6ce93e16b392051
bacfee268cc5d4f6aaa2e6e0066d38f5
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UnB - Universidade de Brasília (UnB)
repository.mail.fl_str_mv
_version_ 1797405352122122240