Hardware paralelo reconfigurável para identificação de alinhamentos de sequências de DNA.
Autor(a) principal: | |
---|---|
Data de Publicação: | 2012 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da UERJ |
Texto Completo: | http://www.bdtd.uerj.br/handle/1/11786 |
Resumo: | DNA samples are found in fragments, obtained in traces of a crime scene, collected from hair or blood samples, for genetic or paternity tests. To identify whether this fragment belongs or not to a given DNA sequence it is necessary to compare it with a determined sequence which usually come from a database, for instance, to point a suspect. To this end, we need an efficient tool to perform the alignment of the DNA sequence found with the ones stored in the database. The alignment of DNA sequences, which is a field of bioinformatics that helps to understand the relationship between genetic sequences and their functional relationships and parenting. This task is often performed by software that scan clusters of databases, which requires high computing effort, thus increasing the cost of DNA sequences alignment projects. This work presents a parallel hardware architecture, for BLAST algorithm, to DNA pairwise alignment. This is the original version of the BLAST algorithm, that resulted in several other versions. The BLAST algorithm is a heuristic method and is the fastest algorithm for sequence alignment. The strategy of BLAST is to divide the sequences into smaller subsequences of size w. After making comparisons in these subsequences, algorithm steps analyzes only the subsequences that are identical. Thus, reducing the number of tests and combinations needed to perform the alignment. For each identical sequence found, three steps are followed by the algorithm: seeding, extension and evaluation. The proposed hardware architecture is based on the characteristics of the algorithm to implement a fully parallel hardware, where the basic steps of BLAST are pipelined. The proposed architecture was implemented in FPGA and the results show a comparison between the area occupied, number of cycles and maximum frequency of operation permitted, as a function of alignment parameters. The result is a hardware architecture in reconfigurable logic, scalable, efficient and with low cost, capable of aligning the pairs of sequences using BLAST algorithm. |
id |
UERJ_9823dd6a8bbc999b6465c2e73f87fc39 |
---|---|
oai_identifier_str |
oai:www.bdtd.uerj.br:1/11786 |
network_acronym_str |
UERJ |
network_name_str |
Biblioteca Digital de Teses e Dissertações da UERJ |
repository_id_str |
2903 |
spelling |
Nedjah, Nadiahttp://lattes.cnpq.br/5417946704251656Mourelle, Luiza de Macedohttp://lattes.cnpq.br/4189604454431782Lima, Carlos Raimundo Erighttp://lattes.cnpq.br/4877049377460293Marzulo, Leandro Augusto Justenhttp://lattes.cnpq.br/4869894816851795http://lattes.cnpq.br/4282182896951915Neto Segundo, Edgar José Garcia2021-01-06T19:17:59Z2014-10-102012-08-09http://www.bdtd.uerj.br/handle/1/11786DNA samples are found in fragments, obtained in traces of a crime scene, collected from hair or blood samples, for genetic or paternity tests. To identify whether this fragment belongs or not to a given DNA sequence it is necessary to compare it with a determined sequence which usually come from a database, for instance, to point a suspect. To this end, we need an efficient tool to perform the alignment of the DNA sequence found with the ones stored in the database. The alignment of DNA sequences, which is a field of bioinformatics that helps to understand the relationship between genetic sequences and their functional relationships and parenting. This task is often performed by software that scan clusters of databases, which requires high computing effort, thus increasing the cost of DNA sequences alignment projects. This work presents a parallel hardware architecture, for BLAST algorithm, to DNA pairwise alignment. This is the original version of the BLAST algorithm, that resulted in several other versions. The BLAST algorithm is a heuristic method and is the fastest algorithm for sequence alignment. The strategy of BLAST is to divide the sequences into smaller subsequences of size w. After making comparisons in these subsequences, algorithm steps analyzes only the subsequences that are identical. Thus, reducing the number of tests and combinations needed to perform the alignment. For each identical sequence found, three steps are followed by the algorithm: seeding, extension and evaluation. The proposed hardware architecture is based on the characteristics of the algorithm to implement a fully parallel hardware, where the basic steps of BLAST are pipelined. The proposed architecture was implemented in FPGA and the results show a comparison between the area occupied, number of cycles and maximum frequency of operation permitted, as a function of alignment parameters. The result is a hardware architecture in reconfigurable logic, scalable, efficient and with low cost, capable of aligning the pairs of sequences using BLAST algorithm.Amostras de DNA são encontradas em fragmentos, obtidos em vestígios de uma cena de crime, ou coletados de amostras de cabelo ou sangue, para testes genéticos ou de paternidade. Para identificar se esse fragmento pertence ou não a uma sequência de DNA, é necessário compará-los com uma sequência determinada, que pode estar armazenada em um banco de dados para, por exemplo, apontar um suspeito. Para tal, é preciso uma ferramenta eficiente para realizar o alinhamento da sequência de DNA encontrada com a armazenada no banco de dados. O alinhamento de sequências de DNA, em inglês DNA matching, é o campo da bioinformática que tenta entender a relação entre as sequências genéticas e suas relações funcionais e parentais. Essa tarefa é frequentemente realizada através de softwares que varrem clusters de base de dados, demandando alto poder computacional, o que encarece o custo de um projeto de alinhamento de sequências de DNA. Esta dissertação apresenta uma arquitetura de hardware paralela, para o algoritmo BLAST, que permite o alinhamento de um par de sequências de DNA. O algoritmo BLAST é um método heurístico e atualmente é o mais rápido. A estratégia do BLAST é dividir as sequências originais em subsequências menores de tamanho w. Após realizar as comparações nessas pequenas subsequências, as etapas do BLAST analisam apenas as subsequências que forem idênticas. Com isso, o algoritmo diminui o número de testes e combinações necessárias para realizar o alinhamento. Para cada sequência idêntica há três etapas, a serem realizadas pelo algoritmo: semeadura, extensão e avaliação. A solução proposta se inspira nas características do algoritmo para implementar um hardware totalmente paralelo e com pipeline entre as etapas básicas do BLAST. A arquitetura de hardware proposta foi implementada em FPGA e os resultados obtidos mostram a comparação entre área ocupada, número de ciclos e máxima frequência de operação permitida, em função dos parâmetros de alinhamento. O resultado é uma arquitetura de hardware em lógica reconfigurável, escalável, eficiente e de baixo custo, capaz de alinhar pares de sequências utilizando o algoritmo BLAST.Submitted by Boris Flegr (boris@uerj.br) on 2021-01-06T19:17:59Z No. of bitstreams: 1 Edgar Jose Garcia Neto Segundo.pdf: 942071 bytes, checksum: a50d865d2f908892347c56f9d5437cc3 (MD5)Made available in DSpace on 2021-01-06T19:17:59Z (GMT). No. of bitstreams: 1 Edgar Jose Garcia Neto Segundo.pdf: 942071 bytes, checksum: a50d865d2f908892347c56f9d5437cc3 (MD5) Previous issue date: 2012-08-09application/pdfporUniversidade do Estado do Rio de JaneiroPrograma de Pós-Graduação em Engenharia EletrônicaUERJBRCentro de Tecnologia e Ciências::Faculdade de EngenhariaElectronic EngineeringDNA MatchingBioinformaticsHardwareParallel ArchitectureHeuristicEngenharia EletrônicaAlinhamento de DNABioinformáticaHardware ReconfigurávelArquiteturas ParalelasPipelineHeurísticaCNPQ::ENGENHARIASHardware paralelo reconfigurável para identificação de alinhamentos de sequências de DNA.Parallel reconfigurable hardware to identify alignments in DNA sequences.info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UERJinstname:Universidade do Estado do Rio de Janeiro (UERJ)instacron:UERJORIGINALEdgar Jose Garcia Neto Segundo.pdfapplication/pdf942071http://www.bdtd.uerj.br/bitstream/1/11786/1/Edgar+Jose+Garcia+Neto+Segundo.pdfa50d865d2f908892347c56f9d5437cc3MD511/117862024-02-27 15:16:50.203oai:www.bdtd.uerj.br:1/11786Biblioteca Digital de Teses e Dissertaçõeshttp://www.bdtd.uerj.br/PUBhttps://www.bdtd.uerj.br:8443/oai/requestbdtd.suporte@uerj.bropendoar:29032024-02-27T18:16:50Biblioteca Digital de Teses e Dissertações da UERJ - Universidade do Estado do Rio de Janeiro (UERJ)false |
dc.title.por.fl_str_mv |
Hardware paralelo reconfigurável para identificação de alinhamentos de sequências de DNA. |
dc.title.alternative.eng.fl_str_mv |
Parallel reconfigurable hardware to identify alignments in DNA sequences. |
title |
Hardware paralelo reconfigurável para identificação de alinhamentos de sequências de DNA. |
spellingShingle |
Hardware paralelo reconfigurável para identificação de alinhamentos de sequências de DNA. Neto Segundo, Edgar José Garcia Electronic Engineering DNA Matching Bioinformatics Hardware Parallel Architecture Heuristic Engenharia Eletrônica Alinhamento de DNA Bioinformática Hardware Reconfigurável Arquiteturas Paralelas Pipeline Heurística CNPQ::ENGENHARIAS |
title_short |
Hardware paralelo reconfigurável para identificação de alinhamentos de sequências de DNA. |
title_full |
Hardware paralelo reconfigurável para identificação de alinhamentos de sequências de DNA. |
title_fullStr |
Hardware paralelo reconfigurável para identificação de alinhamentos de sequências de DNA. |
title_full_unstemmed |
Hardware paralelo reconfigurável para identificação de alinhamentos de sequências de DNA. |
title_sort |
Hardware paralelo reconfigurável para identificação de alinhamentos de sequências de DNA. |
author |
Neto Segundo, Edgar José Garcia |
author_facet |
Neto Segundo, Edgar José Garcia |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Nedjah, Nadia |
dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/5417946704251656 |
dc.contributor.advisor-co1.fl_str_mv |
Mourelle, Luiza de Macedo |
dc.contributor.advisor-co1Lattes.fl_str_mv |
http://lattes.cnpq.br/4189604454431782 |
dc.contributor.referee1.fl_str_mv |
Lima, Carlos Raimundo Erig |
dc.contributor.referee1Lattes.fl_str_mv |
http://lattes.cnpq.br/4877049377460293 |
dc.contributor.referee2.fl_str_mv |
Marzulo, Leandro Augusto Justen |
dc.contributor.referee2Lattes.fl_str_mv |
http://lattes.cnpq.br/4869894816851795 |
dc.contributor.authorLattes.fl_str_mv |
http://lattes.cnpq.br/4282182896951915 |
dc.contributor.author.fl_str_mv |
Neto Segundo, Edgar José Garcia |
contributor_str_mv |
Nedjah, Nadia Mourelle, Luiza de Macedo Lima, Carlos Raimundo Erig Marzulo, Leandro Augusto Justen |
dc.subject.eng.fl_str_mv |
Electronic Engineering DNA Matching Bioinformatics Hardware Parallel Architecture Heuristic |
topic |
Electronic Engineering DNA Matching Bioinformatics Hardware Parallel Architecture Heuristic Engenharia Eletrônica Alinhamento de DNA Bioinformática Hardware Reconfigurável Arquiteturas Paralelas Pipeline Heurística CNPQ::ENGENHARIAS |
dc.subject.por.fl_str_mv |
Engenharia Eletrônica Alinhamento de DNA Bioinformática Hardware Reconfigurável Arquiteturas Paralelas Pipeline Heurística |
dc.subject.cnpq.fl_str_mv |
CNPQ::ENGENHARIAS |
description |
DNA samples are found in fragments, obtained in traces of a crime scene, collected from hair or blood samples, for genetic or paternity tests. To identify whether this fragment belongs or not to a given DNA sequence it is necessary to compare it with a determined sequence which usually come from a database, for instance, to point a suspect. To this end, we need an efficient tool to perform the alignment of the DNA sequence found with the ones stored in the database. The alignment of DNA sequences, which is a field of bioinformatics that helps to understand the relationship between genetic sequences and their functional relationships and parenting. This task is often performed by software that scan clusters of databases, which requires high computing effort, thus increasing the cost of DNA sequences alignment projects. This work presents a parallel hardware architecture, for BLAST algorithm, to DNA pairwise alignment. This is the original version of the BLAST algorithm, that resulted in several other versions. The BLAST algorithm is a heuristic method and is the fastest algorithm for sequence alignment. The strategy of BLAST is to divide the sequences into smaller subsequences of size w. After making comparisons in these subsequences, algorithm steps analyzes only the subsequences that are identical. Thus, reducing the number of tests and combinations needed to perform the alignment. For each identical sequence found, three steps are followed by the algorithm: seeding, extension and evaluation. The proposed hardware architecture is based on the characteristics of the algorithm to implement a fully parallel hardware, where the basic steps of BLAST are pipelined. The proposed architecture was implemented in FPGA and the results show a comparison between the area occupied, number of cycles and maximum frequency of operation permitted, as a function of alignment parameters. The result is a hardware architecture in reconfigurable logic, scalable, efficient and with low cost, capable of aligning the pairs of sequences using BLAST algorithm. |
publishDate |
2012 |
dc.date.issued.fl_str_mv |
2012-08-09 |
dc.date.available.fl_str_mv |
2014-10-10 |
dc.date.accessioned.fl_str_mv |
2021-01-06T19:17:59Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://www.bdtd.uerj.br/handle/1/11786 |
url |
http://www.bdtd.uerj.br/handle/1/11786 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade do Estado do Rio de Janeiro |
dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Engenharia Eletrônica |
dc.publisher.initials.fl_str_mv |
UERJ |
dc.publisher.country.fl_str_mv |
BR |
dc.publisher.department.fl_str_mv |
Centro de Tecnologia e Ciências::Faculdade de Engenharia |
publisher.none.fl_str_mv |
Universidade do Estado do Rio de Janeiro |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UERJ instname:Universidade do Estado do Rio de Janeiro (UERJ) instacron:UERJ |
instname_str |
Universidade do Estado do Rio de Janeiro (UERJ) |
instacron_str |
UERJ |
institution |
UERJ |
reponame_str |
Biblioteca Digital de Teses e Dissertações da UERJ |
collection |
Biblioteca Digital de Teses e Dissertações da UERJ |
bitstream.url.fl_str_mv |
http://www.bdtd.uerj.br/bitstream/1/11786/1/Edgar+Jose+Garcia+Neto+Segundo.pdf |
bitstream.checksum.fl_str_mv |
a50d865d2f908892347c56f9d5437cc3 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UERJ - Universidade do Estado do Rio de Janeiro (UERJ) |
repository.mail.fl_str_mv |
bdtd.suporte@uerj.br |
_version_ |
1811728660945698816 |