Computação paralela na classificação de proteínas sobre a plataforma Cellbe
Autor(a) principal: | |
---|---|
Data de Publicação: | 2010 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/10451/5389 |
Resumo: | Tese de mestrado, Informática, Universidade de Lisboa, Faculdade de Ciências, 2010 |
id |
RCAP_fb833d4242192e93e53576d0ad8f1b86 |
---|---|
oai_identifier_str |
oai:repositorio.ul.pt:10451/5389 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Computação paralela na classificação de proteínas sobre a plataforma CellbeComputação paralelaBioinformáticaAlgoritmo de classificação de sequênciasProcessador multi-núcleoCellbeTeses de mestrado - 2010Tese de mestrado, Informática, Universidade de Lisboa, Faculdade de Ciências, 2010Um dos problemas maiores da bioinformática é a previsão de função de uma proteína. A tecnologia existente já permite obter milhões e milhões de sequências a custo muito reduzido, mas a compreensão de sua função dentro dos vários organismos é ainda um grande mistério para a larga maioria de sequências proteicas existentes. A criação de software eficiente que permita analisar bases de dados de proteínas em busca de metadados é também um desafio para os biólogos e uma área de estudo recente para os cientistas da computação, por representar uma alternativa de baixo custo aos métodos de teste em laboratório. Uma metodologia que se propõe analisar estas bases de dados e anotar as proteínas são os Peptide Programs (PepProg), uma metodologia de aprendizagem automática (machine learning) para classificação funcional de sequências biológicas. Esta dissertação de mestrado se propôs a estudar meios de optimizar o desempenho da implementação existente do método PepProg através da construção de uma implementação alternativa que explore a arquitectura do processador CellBE, presente nas consolas Playstation 3 disponibilizadas pelo Departamento de Informática da Universidade de Lisboa. Para explorar os recursos do CellBE, foi necessário primeiro modificar a implementação existente do método PepProg para que pudesse correr instruções do tipo Single Instruction Multiple Data (SIMD). Esta modificação denominada vectorização, é necessária para que os múltiplos núcleos do processador CellBE pudessem ser utilizados, transformando o PepProg num algoritmo paralelo dentro da arquitectura CellBE. Com o estudo realizado, pode-se concluir que as propostas de vectorização sugeridas nesta dissertação não foram suficientes para a construção de um PepProg paralelo mais eficiente, pois o custo da vectorização do algoritmo em tempo de execução provou-se ser tão alto a ponto de não poder ser compensado pela paralelização do algoritmo.One of the biggest problems on bioinformatics is protein function determination. The existing technology allows the obtaining of millions and millions sequences at very reduced cost, but the understanding of its function inside organisms is still a great mystery for the wide majority of proteomic sequences. The creation of efficient software that allows protein database analyzes in search for metadata is also a challenge for the biologists and an area of recent study for the computation scientists, as it represent a low cost method alternatively to laboratory test methods. A methodology that considers database analysis to write down proteins is the Peptide Programs (PepProg), an automatic learning methodology (machine learning) for functional sorting of biological sequences. This master's degree dissertation studied ways to optimize the existing implementation of the method PepProg by the construction of an alternative implementation that explores CellBE processor architecture, found on Playstation 3 consoles made available by Departamento de Informática of the Universidade de Lisboa. To explore CellBE resources, it was necessary a modification of the existing PepProg implementation to guarantee that only single-instruction multiple-data (SIMD) instructions was present on code. This process, named vectorization, is a prerequisite to allow PepProg program run on CellBE multiple cores in a parallel way. With the accomplished study, it can be concluded that the vectorization methods proposed by this study were not enough for the construction of a more efficient parallel PepProg, because the algorithm vectorization cost in execution time proved to be so high, that the PepProg parallelization gain was not sufficient to compensate the extra computational processing demanded by the vectorization.Calha, Mário João BarataFalcão, André Osório e Cruz de AzerêdoRepositório da Universidade de LisboaSchuenemann, Hermann Pimentel2012-02-24T10:36:29Z20102010-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10451/5389porinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-11-08T15:47:03Zoai:repositorio.ul.pt:10451/5389Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T21:30:45.627544Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Computação paralela na classificação de proteínas sobre a plataforma Cellbe |
title |
Computação paralela na classificação de proteínas sobre a plataforma Cellbe |
spellingShingle |
Computação paralela na classificação de proteínas sobre a plataforma Cellbe Schuenemann, Hermann Pimentel Computação paralela Bioinformática Algoritmo de classificação de sequências Processador multi-núcleo Cellbe Teses de mestrado - 2010 |
title_short |
Computação paralela na classificação de proteínas sobre a plataforma Cellbe |
title_full |
Computação paralela na classificação de proteínas sobre a plataforma Cellbe |
title_fullStr |
Computação paralela na classificação de proteínas sobre a plataforma Cellbe |
title_full_unstemmed |
Computação paralela na classificação de proteínas sobre a plataforma Cellbe |
title_sort |
Computação paralela na classificação de proteínas sobre a plataforma Cellbe |
author |
Schuenemann, Hermann Pimentel |
author_facet |
Schuenemann, Hermann Pimentel |
author_role |
author |
dc.contributor.none.fl_str_mv |
Calha, Mário João Barata Falcão, André Osório e Cruz de Azerêdo Repositório da Universidade de Lisboa |
dc.contributor.author.fl_str_mv |
Schuenemann, Hermann Pimentel |
dc.subject.por.fl_str_mv |
Computação paralela Bioinformática Algoritmo de classificação de sequências Processador multi-núcleo Cellbe Teses de mestrado - 2010 |
topic |
Computação paralela Bioinformática Algoritmo de classificação de sequências Processador multi-núcleo Cellbe Teses de mestrado - 2010 |
description |
Tese de mestrado, Informática, Universidade de Lisboa, Faculdade de Ciências, 2010 |
publishDate |
2010 |
dc.date.none.fl_str_mv |
2010 2010-01-01T00:00:00Z 2012-02-24T10:36:29Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10451/5389 |
url |
http://hdl.handle.net/10451/5389 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799134195671367680 |