Algoritmos paralelos para o alinhamento de sequências genômicas
Autor(a) principal: | |
---|---|
Data de Publicação: | 2014 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFMS |
Texto Completo: | https://repositorio.ufms.br/handle/123456789/2074 |
Resumo: | No estudo da evolução dos organismos, ou das funções biológicas das moléculas, é comum a comparação entre diferentes organismos, ou moléculas, onde, em geral, essas moléculas são DNA, RNA ou proteínas, que são facilmente representadas por sequências de caracteres. A análise dessas várias sequências é um problema que necessita de muito tempo para ser realizada. Visando diminuir esse tempo são desenvolvidos métodos utilizando programação paralela com granulosidade híbrida, sendo essa paralelização necessária para tratar várias sequências com mais de 1000 caracteres. Neste trabalho estudamos o alinhamento de várias sequências e implementamos um algoritmo paralelo para este problema e comparamos o desempenho com o algoritmo sequencial utilizado pelo ClustalW, obtendo speedups que variam entre 61 e 8200, e com o algoritmo paralelo utilizado pelo ClustalWMPI, obtendo speedups que variam entre 44 e 280, quando temos muitas sequências de tamanho pequeno e quando temos um número considerável de sequências de tamanho grande, respectivamente, em ambas as comparações. |
id |
UFMS_47720a4809e7000d86781dd519848185 |
---|---|
oai_identifier_str |
oai:repositorio.ufms.br:123456789/2074 |
network_acronym_str |
UFMS |
network_name_str |
Repositório Institucional da UFMS |
repository_id_str |
2124 |
spelling |
2014-11-15T03:09:13Z2021-09-30T19:57:41Z2014https://repositorio.ufms.br/handle/123456789/2074No estudo da evolução dos organismos, ou das funções biológicas das moléculas, é comum a comparação entre diferentes organismos, ou moléculas, onde, em geral, essas moléculas são DNA, RNA ou proteínas, que são facilmente representadas por sequências de caracteres. A análise dessas várias sequências é um problema que necessita de muito tempo para ser realizada. Visando diminuir esse tempo são desenvolvidos métodos utilizando programação paralela com granulosidade híbrida, sendo essa paralelização necessária para tratar várias sequências com mais de 1000 caracteres. Neste trabalho estudamos o alinhamento de várias sequências e implementamos um algoritmo paralelo para este problema e comparamos o desempenho com o algoritmo sequencial utilizado pelo ClustalW, obtendo speedups que variam entre 61 e 8200, e com o algoritmo paralelo utilizado pelo ClustalWMPI, obtendo speedups que variam entre 44 e 280, quando temos muitas sequências de tamanho pequeno e quando temos um número considerável de sequências de tamanho grande, respectivamente, em ambas as comparações.ABSTRACT - In the study of evolution and biological functions of molecules is common to compare different organisms or molecules, where, in general, these molecules are DNA, RNA or proteins that are easily represented by sequences of characters. The analysis of these sequences, either in pairs or in multiple sequences, is a problem that needs much time to be performed. And, aiming to reduce that time, parallel programming methods are developed, using hybrid granularity, and this parallelization is required to treat sequences in pratical scales. We have studied the multiple sequence alignment and implemented a parallel algorithm for this problem and we have compared the performance with the sequential algorithm used by the ClustalW, obtaining speedups between 61 and 8200, and with the parallel algorithm ClustalW-MPI, obtaining speedups between 44 and 280, when we have many small sequences and when we have few sequences with big size.porAlgorítmos ParalelosProgramação Paralela (Computação)BioinformáticaParallel AlgorithmsParallel Programming (Computer Science)BioinformaticsAlgoritmos paralelos para o alinhamento de sequências genômicasinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisStefanes, Marco AurélioSilva, Pedro Henrique Neves dainfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFMSinstname:Universidade Federal de Mato Grosso do Sul (UFMS)instacron:UFMSTHUMBNAILPedro Henrique Neves da Silva.pdf.jpgPedro Henrique Neves da Silva.pdf.jpgGenerated Thumbnailimage/jpeg1363https://repositorio.ufms.br/bitstream/123456789/2074/4/Pedro%20Henrique%20Neves%20da%20Silva.pdf.jpg461c999a899843cc43b59bc7c2782a1cMD54ORIGINALPedro Henrique Neves da Silva.pdfPedro Henrique Neves da Silva.pdfapplication/pdf565288https://repositorio.ufms.br/bitstream/123456789/2074/1/Pedro%20Henrique%20Neves%20da%20Silva.pdfa9d50e25b34870b5c65c3d0782ace0fdMD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repositorio.ufms.br/bitstream/123456789/2074/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52TEXTPedro Henrique Neves da Silva.pdf.txtPedro Henrique Neves da Silva.pdf.txtExtracted texttext/plain0https://repositorio.ufms.br/bitstream/123456789/2074/3/Pedro%20Henrique%20Neves%20da%20Silva.pdf.txtd41d8cd98f00b204e9800998ecf8427eMD53123456789/20742021-09-30 15:57:41.807oai:repositorio.ufms.br:123456789/2074Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório InstitucionalPUBhttps://repositorio.ufms.br/oai/requestri.prograd@ufms.bropendoar:21242021-09-30T19:57:41Repositório Institucional da UFMS - Universidade Federal de Mato Grosso do Sul (UFMS)false |
dc.title.pt_BR.fl_str_mv |
Algoritmos paralelos para o alinhamento de sequências genômicas |
title |
Algoritmos paralelos para o alinhamento de sequências genômicas |
spellingShingle |
Algoritmos paralelos para o alinhamento de sequências genômicas Silva, Pedro Henrique Neves da Algorítmos Paralelos Programação Paralela (Computação) Bioinformática Parallel Algorithms Parallel Programming (Computer Science) Bioinformatics |
title_short |
Algoritmos paralelos para o alinhamento de sequências genômicas |
title_full |
Algoritmos paralelos para o alinhamento de sequências genômicas |
title_fullStr |
Algoritmos paralelos para o alinhamento de sequências genômicas |
title_full_unstemmed |
Algoritmos paralelos para o alinhamento de sequências genômicas |
title_sort |
Algoritmos paralelos para o alinhamento de sequências genômicas |
author |
Silva, Pedro Henrique Neves da |
author_facet |
Silva, Pedro Henrique Neves da |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Stefanes, Marco Aurélio |
dc.contributor.author.fl_str_mv |
Silva, Pedro Henrique Neves da |
contributor_str_mv |
Stefanes, Marco Aurélio |
dc.subject.por.fl_str_mv |
Algorítmos Paralelos Programação Paralela (Computação) Bioinformática Parallel Algorithms Parallel Programming (Computer Science) Bioinformatics |
topic |
Algorítmos Paralelos Programação Paralela (Computação) Bioinformática Parallel Algorithms Parallel Programming (Computer Science) Bioinformatics |
description |
No estudo da evolução dos organismos, ou das funções biológicas das moléculas, é comum a comparação entre diferentes organismos, ou moléculas, onde, em geral, essas moléculas são DNA, RNA ou proteínas, que são facilmente representadas por sequências de caracteres. A análise dessas várias sequências é um problema que necessita de muito tempo para ser realizada. Visando diminuir esse tempo são desenvolvidos métodos utilizando programação paralela com granulosidade híbrida, sendo essa paralelização necessária para tratar várias sequências com mais de 1000 caracteres. Neste trabalho estudamos o alinhamento de várias sequências e implementamos um algoritmo paralelo para este problema e comparamos o desempenho com o algoritmo sequencial utilizado pelo ClustalW, obtendo speedups que variam entre 61 e 8200, e com o algoritmo paralelo utilizado pelo ClustalWMPI, obtendo speedups que variam entre 44 e 280, quando temos muitas sequências de tamanho pequeno e quando temos um número considerável de sequências de tamanho grande, respectivamente, em ambas as comparações. |
publishDate |
2014 |
dc.date.accessioned.fl_str_mv |
2014-11-15T03:09:13Z |
dc.date.issued.fl_str_mv |
2014 |
dc.date.available.fl_str_mv |
2021-09-30T19:57:41Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufms.br/handle/123456789/2074 |
url |
https://repositorio.ufms.br/handle/123456789/2074 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFMS instname:Universidade Federal de Mato Grosso do Sul (UFMS) instacron:UFMS |
instname_str |
Universidade Federal de Mato Grosso do Sul (UFMS) |
instacron_str |
UFMS |
institution |
UFMS |
reponame_str |
Repositório Institucional da UFMS |
collection |
Repositório Institucional da UFMS |
bitstream.url.fl_str_mv |
https://repositorio.ufms.br/bitstream/123456789/2074/4/Pedro%20Henrique%20Neves%20da%20Silva.pdf.jpg https://repositorio.ufms.br/bitstream/123456789/2074/1/Pedro%20Henrique%20Neves%20da%20Silva.pdf https://repositorio.ufms.br/bitstream/123456789/2074/2/license.txt https://repositorio.ufms.br/bitstream/123456789/2074/3/Pedro%20Henrique%20Neves%20da%20Silva.pdf.txt |
bitstream.checksum.fl_str_mv |
461c999a899843cc43b59bc7c2782a1c a9d50e25b34870b5c65c3d0782ace0fd 8a4605be74aa9ea9d79846c1fba20a33 d41d8cd98f00b204e9800998ecf8427e |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFMS - Universidade Federal de Mato Grosso do Sul (UFMS) |
repository.mail.fl_str_mv |
ri.prograd@ufms.br |
_version_ |
1818603613275029504 |