Hardware paralelo reconfigurável para identificação de alinhamentos de sequências de DNA.

Detalhes bibliográficos
Autor(a) principal: Neto Segundo, Edgar José Garcia
Data de Publicação: 2012
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da UERJ
Texto Completo: http://www.bdtd.uerj.br/handle/1/11786
Resumo: DNA samples are found in fragments, obtained in traces of a crime scene, collected from hair or blood samples, for genetic or paternity tests. To identify whether this fragment belongs or not to a given DNA sequence it is necessary to compare it with a determined sequence which usually come from a database, for instance, to point a suspect. To this end, we need an efficient tool to perform the alignment of the DNA sequence found with the ones stored in the database. The alignment of DNA sequences, which is a field of bioinformatics that helps to understand the relationship between genetic sequences and their functional relationships and parenting. This task is often performed by software that scan clusters of databases, which requires high computing effort, thus increasing the cost of DNA sequences alignment projects. This work presents a parallel hardware architecture, for BLAST algorithm, to DNA pairwise alignment. This is the original version of the BLAST algorithm, that resulted in several other versions. The BLAST algorithm is a heuristic method and is the fastest algorithm for sequence alignment. The strategy of BLAST is to divide the sequences into smaller subsequences of size w. After making comparisons in these subsequences, algorithm steps analyzes only the subsequences that are identical. Thus, reducing the number of tests and combinations needed to perform the alignment. For each identical sequence found, three steps are followed by the algorithm: seeding, extension and evaluation. The proposed hardware architecture is based on the characteristics of the algorithm to implement a fully parallel hardware, where the basic steps of BLAST are pipelined. The proposed architecture was implemented in FPGA and the results show a comparison between the area occupied, number of cycles and maximum frequency of operation permitted, as a function of alignment parameters. The result is a hardware architecture in reconfigurable logic, scalable, efficient and with low cost, capable of aligning the pairs of sequences using BLAST algorithm.
id UERJ_9823dd6a8bbc999b6465c2e73f87fc39
oai_identifier_str oai:www.bdtd.uerj.br:1/11786
network_acronym_str UERJ
network_name_str Biblioteca Digital de Teses e Dissertações da UERJ
repository_id_str 2903
spelling Nedjah, Nadiahttp://lattes.cnpq.br/5417946704251656Mourelle, Luiza de Macedohttp://lattes.cnpq.br/4189604454431782Lima, Carlos Raimundo Erighttp://lattes.cnpq.br/4877049377460293Marzulo, Leandro Augusto Justenhttp://lattes.cnpq.br/4869894816851795http://lattes.cnpq.br/4282182896951915Neto Segundo, Edgar José Garcia2021-01-06T19:17:59Z2014-10-102012-08-09http://www.bdtd.uerj.br/handle/1/11786DNA samples are found in fragments, obtained in traces of a crime scene, collected from hair or blood samples, for genetic or paternity tests. To identify whether this fragment belongs or not to a given DNA sequence it is necessary to compare it with a determined sequence which usually come from a database, for instance, to point a suspect. To this end, we need an efficient tool to perform the alignment of the DNA sequence found with the ones stored in the database. The alignment of DNA sequences, which is a field of bioinformatics that helps to understand the relationship between genetic sequences and their functional relationships and parenting. This task is often performed by software that scan clusters of databases, which requires high computing effort, thus increasing the cost of DNA sequences alignment projects. This work presents a parallel hardware architecture, for BLAST algorithm, to DNA pairwise alignment. This is the original version of the BLAST algorithm, that resulted in several other versions. The BLAST algorithm is a heuristic method and is the fastest algorithm for sequence alignment. The strategy of BLAST is to divide the sequences into smaller subsequences of size w. After making comparisons in these subsequences, algorithm steps analyzes only the subsequences that are identical. Thus, reducing the number of tests and combinations needed to perform the alignment. For each identical sequence found, three steps are followed by the algorithm: seeding, extension and evaluation. The proposed hardware architecture is based on the characteristics of the algorithm to implement a fully parallel hardware, where the basic steps of BLAST are pipelined. The proposed architecture was implemented in FPGA and the results show a comparison between the area occupied, number of cycles and maximum frequency of operation permitted, as a function of alignment parameters. The result is a hardware architecture in reconfigurable logic, scalable, efficient and with low cost, capable of aligning the pairs of sequences using BLAST algorithm.Amostras de DNA são encontradas em fragmentos, obtidos em vestígios de uma cena de crime, ou coletados de amostras de cabelo ou sangue, para testes genéticos ou de paternidade. Para identificar se esse fragmento pertence ou não a uma sequência de DNA, é necessário compará-los com uma sequência determinada, que pode estar armazenada em um banco de dados para, por exemplo, apontar um suspeito. Para tal, é preciso uma ferramenta eficiente para realizar o alinhamento da sequência de DNA encontrada com a armazenada no banco de dados. O alinhamento de sequências de DNA, em inglês DNA matching, é o campo da bioinformática que tenta entender a relação entre as sequências genéticas e suas relações funcionais e parentais. Essa tarefa é frequentemente realizada através de softwares que varrem clusters de base de dados, demandando alto poder computacional, o que encarece o custo de um projeto de alinhamento de sequências de DNA. Esta dissertação apresenta uma arquitetura de hardware paralela, para o algoritmo BLAST, que permite o alinhamento de um par de sequências de DNA. O algoritmo BLAST é um método heurístico e atualmente é o mais rápido. A estratégia do BLAST é dividir as sequências originais em subsequências menores de tamanho w. Após realizar as comparações nessas pequenas subsequências, as etapas do BLAST analisam apenas as subsequências que forem idênticas. Com isso, o algoritmo diminui o número de testes e combinações necessárias para realizar o alinhamento. Para cada sequência idêntica há três etapas, a serem realizadas pelo algoritmo: semeadura, extensão e avaliação. A solução proposta se inspira nas características do algoritmo para implementar um hardware totalmente paralelo e com pipeline entre as etapas básicas do BLAST. A arquitetura de hardware proposta foi implementada em FPGA e os resultados obtidos mostram a comparação entre área ocupada, número de ciclos e máxima frequência de operação permitida, em função dos parâmetros de alinhamento. O resultado é uma arquitetura de hardware em lógica reconfigurável, escalável, eficiente e de baixo custo, capaz de alinhar pares de sequências utilizando o algoritmo BLAST.Submitted by Boris Flegr (boris@uerj.br) on 2021-01-06T19:17:59Z No. of bitstreams: 1 Edgar Jose Garcia Neto Segundo.pdf: 942071 bytes, checksum: a50d865d2f908892347c56f9d5437cc3 (MD5)Made available in DSpace on 2021-01-06T19:17:59Z (GMT). No. of bitstreams: 1 Edgar Jose Garcia Neto Segundo.pdf: 942071 bytes, checksum: a50d865d2f908892347c56f9d5437cc3 (MD5) Previous issue date: 2012-08-09application/pdfporUniversidade do Estado do Rio de JaneiroPrograma de Pós-Graduação em Engenharia EletrônicaUERJBRCentro de Tecnologia e Ciências::Faculdade de EngenhariaElectronic EngineeringDNA MatchingBioinformaticsHardwareParallel ArchitectureHeuristicEngenharia EletrônicaAlinhamento de DNABioinformáticaHardware ReconfigurávelArquiteturas ParalelasPipelineHeurísticaCNPQ::ENGENHARIASHardware paralelo reconfigurável para identificação de alinhamentos de sequências de DNA.Parallel reconfigurable hardware to identify alignments in DNA sequences.info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UERJinstname:Universidade do Estado do Rio de Janeiro (UERJ)instacron:UERJORIGINALEdgar Jose Garcia Neto Segundo.pdfapplication/pdf942071http://www.bdtd.uerj.br/bitstream/1/11786/1/Edgar+Jose+Garcia+Neto+Segundo.pdfa50d865d2f908892347c56f9d5437cc3MD511/117862024-02-27 15:16:50.203oai:www.bdtd.uerj.br:1/11786Biblioteca Digital de Teses e Dissertaçõeshttp://www.bdtd.uerj.br/PUBhttps://www.bdtd.uerj.br:8443/oai/requestbdtd.suporte@uerj.bropendoar:29032024-02-27T18:16:50Biblioteca Digital de Teses e Dissertações da UERJ - Universidade do Estado do Rio de Janeiro (UERJ)false
dc.title.por.fl_str_mv Hardware paralelo reconfigurável para identificação de alinhamentos de sequências de DNA.
dc.title.alternative.eng.fl_str_mv Parallel reconfigurable hardware to identify alignments in DNA sequences.
title Hardware paralelo reconfigurável para identificação de alinhamentos de sequências de DNA.
spellingShingle Hardware paralelo reconfigurável para identificação de alinhamentos de sequências de DNA.
Neto Segundo, Edgar José Garcia
Electronic Engineering
DNA Matching
Bioinformatics
Hardware
Parallel Architecture
Heuristic
Engenharia Eletrônica
Alinhamento de DNA
Bioinformática
Hardware Reconfigurável
Arquiteturas Paralelas
Pipeline
Heurística
CNPQ::ENGENHARIAS
title_short Hardware paralelo reconfigurável para identificação de alinhamentos de sequências de DNA.
title_full Hardware paralelo reconfigurável para identificação de alinhamentos de sequências de DNA.
title_fullStr Hardware paralelo reconfigurável para identificação de alinhamentos de sequências de DNA.
title_full_unstemmed Hardware paralelo reconfigurável para identificação de alinhamentos de sequências de DNA.
title_sort Hardware paralelo reconfigurável para identificação de alinhamentos de sequências de DNA.
author Neto Segundo, Edgar José Garcia
author_facet Neto Segundo, Edgar José Garcia
author_role author
dc.contributor.advisor1.fl_str_mv Nedjah, Nadia
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/5417946704251656
dc.contributor.advisor-co1.fl_str_mv Mourelle, Luiza de Macedo
dc.contributor.advisor-co1Lattes.fl_str_mv http://lattes.cnpq.br/4189604454431782
dc.contributor.referee1.fl_str_mv Lima, Carlos Raimundo Erig
dc.contributor.referee1Lattes.fl_str_mv http://lattes.cnpq.br/4877049377460293
dc.contributor.referee2.fl_str_mv Marzulo, Leandro Augusto Justen
dc.contributor.referee2Lattes.fl_str_mv http://lattes.cnpq.br/4869894816851795
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/4282182896951915
dc.contributor.author.fl_str_mv Neto Segundo, Edgar José Garcia
contributor_str_mv Nedjah, Nadia
Mourelle, Luiza de Macedo
Lima, Carlos Raimundo Erig
Marzulo, Leandro Augusto Justen
dc.subject.eng.fl_str_mv Electronic Engineering
DNA Matching
Bioinformatics
Hardware
Parallel Architecture
Heuristic
topic Electronic Engineering
DNA Matching
Bioinformatics
Hardware
Parallel Architecture
Heuristic
Engenharia Eletrônica
Alinhamento de DNA
Bioinformática
Hardware Reconfigurável
Arquiteturas Paralelas
Pipeline
Heurística
CNPQ::ENGENHARIAS
dc.subject.por.fl_str_mv Engenharia Eletrônica
Alinhamento de DNA
Bioinformática
Hardware Reconfigurável
Arquiteturas Paralelas
Pipeline
Heurística
dc.subject.cnpq.fl_str_mv CNPQ::ENGENHARIAS
description DNA samples are found in fragments, obtained in traces of a crime scene, collected from hair or blood samples, for genetic or paternity tests. To identify whether this fragment belongs or not to a given DNA sequence it is necessary to compare it with a determined sequence which usually come from a database, for instance, to point a suspect. To this end, we need an efficient tool to perform the alignment of the DNA sequence found with the ones stored in the database. The alignment of DNA sequences, which is a field of bioinformatics that helps to understand the relationship between genetic sequences and their functional relationships and parenting. This task is often performed by software that scan clusters of databases, which requires high computing effort, thus increasing the cost of DNA sequences alignment projects. This work presents a parallel hardware architecture, for BLAST algorithm, to DNA pairwise alignment. This is the original version of the BLAST algorithm, that resulted in several other versions. The BLAST algorithm is a heuristic method and is the fastest algorithm for sequence alignment. The strategy of BLAST is to divide the sequences into smaller subsequences of size w. After making comparisons in these subsequences, algorithm steps analyzes only the subsequences that are identical. Thus, reducing the number of tests and combinations needed to perform the alignment. For each identical sequence found, three steps are followed by the algorithm: seeding, extension and evaluation. The proposed hardware architecture is based on the characteristics of the algorithm to implement a fully parallel hardware, where the basic steps of BLAST are pipelined. The proposed architecture was implemented in FPGA and the results show a comparison between the area occupied, number of cycles and maximum frequency of operation permitted, as a function of alignment parameters. The result is a hardware architecture in reconfigurable logic, scalable, efficient and with low cost, capable of aligning the pairs of sequences using BLAST algorithm.
publishDate 2012
dc.date.issued.fl_str_mv 2012-08-09
dc.date.available.fl_str_mv 2014-10-10
dc.date.accessioned.fl_str_mv 2021-01-06T19:17:59Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://www.bdtd.uerj.br/handle/1/11786
url http://www.bdtd.uerj.br/handle/1/11786
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade do Estado do Rio de Janeiro
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Engenharia Eletrônica
dc.publisher.initials.fl_str_mv UERJ
dc.publisher.country.fl_str_mv BR
dc.publisher.department.fl_str_mv Centro de Tecnologia e Ciências::Faculdade de Engenharia
publisher.none.fl_str_mv Universidade do Estado do Rio de Janeiro
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UERJ
instname:Universidade do Estado do Rio de Janeiro (UERJ)
instacron:UERJ
instname_str Universidade do Estado do Rio de Janeiro (UERJ)
instacron_str UERJ
institution UERJ
reponame_str Biblioteca Digital de Teses e Dissertações da UERJ
collection Biblioteca Digital de Teses e Dissertações da UERJ
bitstream.url.fl_str_mv http://www.bdtd.uerj.br/bitstream/1/11786/1/Edgar+Jose+Garcia+Neto+Segundo.pdf
bitstream.checksum.fl_str_mv a50d865d2f908892347c56f9d5437cc3
bitstream.checksumAlgorithm.fl_str_mv MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UERJ - Universidade do Estado do Rio de Janeiro (UERJ)
repository.mail.fl_str_mv bdtd.suporte@uerj.br
_version_ 1811728660945698816