Algoritmos paralelos para o alinhamento de sequências genômicas

Detalhes bibliográficos
Autor(a) principal: Silva, Pedro Henrique Neves da
Data de Publicação: 2014
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFMS
Texto Completo: https://repositorio.ufms.br/handle/123456789/2074
Resumo: No estudo da evolução dos organismos, ou das funções biológicas das moléculas, é comum a comparação entre diferentes organismos, ou moléculas, onde, em geral, essas moléculas são DNA, RNA ou proteínas, que são facilmente representadas por sequências de caracteres. A análise dessas várias sequências é um problema que necessita de muito tempo para ser realizada. Visando diminuir esse tempo são desenvolvidos métodos utilizando programação paralela com granulosidade híbrida, sendo essa paralelização necessária para tratar várias sequências com mais de 1000 caracteres. Neste trabalho estudamos o alinhamento de várias sequências e implementamos um algoritmo paralelo para este problema e comparamos o desempenho com o algoritmo sequencial utilizado pelo ClustalW, obtendo speedups que variam entre 61 e 8200, e com o algoritmo paralelo utilizado pelo ClustalWMPI, obtendo speedups que variam entre 44 e 280, quando temos muitas sequências de tamanho pequeno e quando temos um número considerável de sequências de tamanho grande, respectivamente, em ambas as comparações.
id UFMS_47720a4809e7000d86781dd519848185
oai_identifier_str oai:repositorio.ufms.br:123456789/2074
network_acronym_str UFMS
network_name_str Repositório Institucional da UFMS
repository_id_str 2124
spelling 2014-11-15T03:09:13Z2021-09-30T19:57:41Z2014https://repositorio.ufms.br/handle/123456789/2074No estudo da evolução dos organismos, ou das funções biológicas das moléculas, é comum a comparação entre diferentes organismos, ou moléculas, onde, em geral, essas moléculas são DNA, RNA ou proteínas, que são facilmente representadas por sequências de caracteres. A análise dessas várias sequências é um problema que necessita de muito tempo para ser realizada. Visando diminuir esse tempo são desenvolvidos métodos utilizando programação paralela com granulosidade híbrida, sendo essa paralelização necessária para tratar várias sequências com mais de 1000 caracteres. Neste trabalho estudamos o alinhamento de várias sequências e implementamos um algoritmo paralelo para este problema e comparamos o desempenho com o algoritmo sequencial utilizado pelo ClustalW, obtendo speedups que variam entre 61 e 8200, e com o algoritmo paralelo utilizado pelo ClustalWMPI, obtendo speedups que variam entre 44 e 280, quando temos muitas sequências de tamanho pequeno e quando temos um número considerável de sequências de tamanho grande, respectivamente, em ambas as comparações.ABSTRACT - In the study of evolution and biological functions of molecules is common to compare different organisms or molecules, where, in general, these molecules are DNA, RNA or proteins that are easily represented by sequences of characters. The analysis of these sequences, either in pairs or in multiple sequences, is a problem that needs much time to be performed. And, aiming to reduce that time, parallel programming methods are developed, using hybrid granularity, and this parallelization is required to treat sequences in pratical scales. We have studied the multiple sequence alignment and implemented a parallel algorithm for this problem and we have compared the performance with the sequential algorithm used by the ClustalW, obtaining speedups between 61 and 8200, and with the parallel algorithm ClustalW-MPI, obtaining speedups between 44 and 280, when we have many small sequences and when we have few sequences with big size.porAlgorítmos ParalelosProgramação Paralela (Computação)BioinformáticaParallel AlgorithmsParallel Programming (Computer Science)BioinformaticsAlgoritmos paralelos para o alinhamento de sequências genômicasinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisStefanes, Marco AurélioSilva, Pedro Henrique Neves dainfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFMSinstname:Universidade Federal de Mato Grosso do Sul (UFMS)instacron:UFMSTHUMBNAILPedro Henrique Neves da Silva.pdf.jpgPedro Henrique Neves da Silva.pdf.jpgGenerated Thumbnailimage/jpeg1363https://repositorio.ufms.br/bitstream/123456789/2074/4/Pedro%20Henrique%20Neves%20da%20Silva.pdf.jpg461c999a899843cc43b59bc7c2782a1cMD54ORIGINALPedro Henrique Neves da Silva.pdfPedro Henrique Neves da Silva.pdfapplication/pdf565288https://repositorio.ufms.br/bitstream/123456789/2074/1/Pedro%20Henrique%20Neves%20da%20Silva.pdfa9d50e25b34870b5c65c3d0782ace0fdMD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repositorio.ufms.br/bitstream/123456789/2074/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52TEXTPedro Henrique Neves da Silva.pdf.txtPedro Henrique Neves da Silva.pdf.txtExtracted texttext/plain0https://repositorio.ufms.br/bitstream/123456789/2074/3/Pedro%20Henrique%20Neves%20da%20Silva.pdf.txtd41d8cd98f00b204e9800998ecf8427eMD53123456789/20742021-09-30 15:57:41.807oai:repositorio.ufms.br:123456789/2074Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório InstitucionalPUBhttps://repositorio.ufms.br/oai/requestri.prograd@ufms.bropendoar:21242021-09-30T19:57:41Repositório Institucional da UFMS - Universidade Federal de Mato Grosso do Sul (UFMS)false
dc.title.pt_BR.fl_str_mv Algoritmos paralelos para o alinhamento de sequências genômicas
title Algoritmos paralelos para o alinhamento de sequências genômicas
spellingShingle Algoritmos paralelos para o alinhamento de sequências genômicas
Silva, Pedro Henrique Neves da
Algorítmos Paralelos
Programação Paralela (Computação)
Bioinformática
Parallel Algorithms
Parallel Programming (Computer Science)
Bioinformatics
title_short Algoritmos paralelos para o alinhamento de sequências genômicas
title_full Algoritmos paralelos para o alinhamento de sequências genômicas
title_fullStr Algoritmos paralelos para o alinhamento de sequências genômicas
title_full_unstemmed Algoritmos paralelos para o alinhamento de sequências genômicas
title_sort Algoritmos paralelos para o alinhamento de sequências genômicas
author Silva, Pedro Henrique Neves da
author_facet Silva, Pedro Henrique Neves da
author_role author
dc.contributor.advisor1.fl_str_mv Stefanes, Marco Aurélio
dc.contributor.author.fl_str_mv Silva, Pedro Henrique Neves da
contributor_str_mv Stefanes, Marco Aurélio
dc.subject.por.fl_str_mv Algorítmos Paralelos
Programação Paralela (Computação)
Bioinformática
Parallel Algorithms
Parallel Programming (Computer Science)
Bioinformatics
topic Algorítmos Paralelos
Programação Paralela (Computação)
Bioinformática
Parallel Algorithms
Parallel Programming (Computer Science)
Bioinformatics
description No estudo da evolução dos organismos, ou das funções biológicas das moléculas, é comum a comparação entre diferentes organismos, ou moléculas, onde, em geral, essas moléculas são DNA, RNA ou proteínas, que são facilmente representadas por sequências de caracteres. A análise dessas várias sequências é um problema que necessita de muito tempo para ser realizada. Visando diminuir esse tempo são desenvolvidos métodos utilizando programação paralela com granulosidade híbrida, sendo essa paralelização necessária para tratar várias sequências com mais de 1000 caracteres. Neste trabalho estudamos o alinhamento de várias sequências e implementamos um algoritmo paralelo para este problema e comparamos o desempenho com o algoritmo sequencial utilizado pelo ClustalW, obtendo speedups que variam entre 61 e 8200, e com o algoritmo paralelo utilizado pelo ClustalWMPI, obtendo speedups que variam entre 44 e 280, quando temos muitas sequências de tamanho pequeno e quando temos um número considerável de sequências de tamanho grande, respectivamente, em ambas as comparações.
publishDate 2014
dc.date.accessioned.fl_str_mv 2014-11-15T03:09:13Z
dc.date.issued.fl_str_mv 2014
dc.date.available.fl_str_mv 2021-09-30T19:57:41Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.ufms.br/handle/123456789/2074
url https://repositorio.ufms.br/handle/123456789/2074
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFMS
instname:Universidade Federal de Mato Grosso do Sul (UFMS)
instacron:UFMS
instname_str Universidade Federal de Mato Grosso do Sul (UFMS)
instacron_str UFMS
institution UFMS
reponame_str Repositório Institucional da UFMS
collection Repositório Institucional da UFMS
bitstream.url.fl_str_mv https://repositorio.ufms.br/bitstream/123456789/2074/4/Pedro%20Henrique%20Neves%20da%20Silva.pdf.jpg
https://repositorio.ufms.br/bitstream/123456789/2074/1/Pedro%20Henrique%20Neves%20da%20Silva.pdf
https://repositorio.ufms.br/bitstream/123456789/2074/2/license.txt
https://repositorio.ufms.br/bitstream/123456789/2074/3/Pedro%20Henrique%20Neves%20da%20Silva.pdf.txt
bitstream.checksum.fl_str_mv 461c999a899843cc43b59bc7c2782a1c
a9d50e25b34870b5c65c3d0782ace0fd
8a4605be74aa9ea9d79846c1fba20a33
d41d8cd98f00b204e9800998ecf8427e
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFMS - Universidade Federal de Mato Grosso do Sul (UFMS)
repository.mail.fl_str_mv ri.prograd@ufms.br
_version_ 1807552857940951040