COMPUTAÇÃO PARALELA NA CLASSIFICAÇÃO DE PROTEÍNAS SOBRE A PLATAFORMA CELLBE

Detalhes bibliográficos
Autor(a) principal: Schuenemann, Hermann Pimentel
Data de Publicação: 2010
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10451/13911
Resumo: Um dos problemas maiores da bioinformática é a previsão de função de uma proteína. A tecnologia existente já permite obter milhões e milhões de sequências a custo muito reduzido, mas a compreensão de sua função dentro dos vários organismos é ainda um grande mistério para a larga maioria de sequências proteicas existentes. A criação de software eficiente que permita analisar bases de dados de proteínas em busca de metadados é também um desafio para os biólogos e uma área de estudo recente para os cientistas da computação, por representar uma alternativa de baixo custo aos métodos de teste em laboratório. Uma metodologia que se propõe analisar estas bases de dados e anotar as proteínas são os Peptide Programs (PepProg), uma metodologia de aprendizagem automática (machine learning) para classificação funcional de sequências biológicas. Esta dissertação de mestrado se propôs a estudar meios de optimizar o desempenho da implementação existente do método PepProg através da construção de uma implementação alternativa que explore a arquitectura do processador CellBE, presente nas consolas Playstation 3 disponibilizadas pelo Departamento de Informática da Universidade de Lisboa. Para explorar os recursos do CellBE, foi necessário primeiro modificar a implementação existente do método PepProg para que pudesse correr instruções do tipo Single Instruction Multiple Data (SIMD). Esta modificação denominada vectorização, é necessária para que os múltiplos núcleos do processador CellBE pudessem ser utilizados, transformando o PepProg num algoritmo paralelo dentro da arquitectura CellBE. Com o estudo realizado, pode-se concluir que as propostas de vectorização sugeridas nesta dissertação não foram suficientes para a construção de um PepProg paralelo mais eficiente, pois o custo da vectorização do algoritmo em tempo de execução provou-se ser tão alto a ponto de não poder ser compensado pela paralelização do algoritmo.
id RCAP_65c087186c7827c1bc4c5719a87e2764
oai_identifier_str oai:repositorio.ul.pt:10451/13911
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling COMPUTAÇÃO PARALELA NA CLASSIFICAÇÃO DE PROTEÍNAS SOBRE A PLATAFORMA CELLBEalgoritmo de classificação de sequênciasprocessador multi-núcleobioinformáticaCellBEComputação paralelaUm dos problemas maiores da bioinformática é a previsão de função de uma proteína. A tecnologia existente já permite obter milhões e milhões de sequências a custo muito reduzido, mas a compreensão de sua função dentro dos vários organismos é ainda um grande mistério para a larga maioria de sequências proteicas existentes. A criação de software eficiente que permita analisar bases de dados de proteínas em busca de metadados é também um desafio para os biólogos e uma área de estudo recente para os cientistas da computação, por representar uma alternativa de baixo custo aos métodos de teste em laboratório. Uma metodologia que se propõe analisar estas bases de dados e anotar as proteínas são os Peptide Programs (PepProg), uma metodologia de aprendizagem automática (machine learning) para classificação funcional de sequências biológicas. Esta dissertação de mestrado se propôs a estudar meios de optimizar o desempenho da implementação existente do método PepProg através da construção de uma implementação alternativa que explore a arquitectura do processador CellBE, presente nas consolas Playstation 3 disponibilizadas pelo Departamento de Informática da Universidade de Lisboa. Para explorar os recursos do CellBE, foi necessário primeiro modificar a implementação existente do método PepProg para que pudesse correr instruções do tipo Single Instruction Multiple Data (SIMD). Esta modificação denominada vectorização, é necessária para que os múltiplos núcleos do processador CellBE pudessem ser utilizados, transformando o PepProg num algoritmo paralelo dentro da arquitectura CellBE. Com o estudo realizado, pode-se concluir que as propostas de vectorização sugeridas nesta dissertação não foram suficientes para a construção de um PepProg paralelo mais eficiente, pois o custo da vectorização do algoritmo em tempo de execução provou-se ser tão alto a ponto de não poder ser compensado pela paralelização do algoritmo.Calha, MárioCalha, MárioRepositório da Universidade de LisboaSchuenemann, Hermann Pimentel2010-11-30T11:02:54Z20102010-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10451/13911porinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-11-08T15:59:22Zoai:repositorio.ul.pt:10451/13911Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T21:35:50.625695Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv COMPUTAÇÃO PARALELA NA CLASSIFICAÇÃO DE PROTEÍNAS SOBRE A PLATAFORMA CELLBE
title COMPUTAÇÃO PARALELA NA CLASSIFICAÇÃO DE PROTEÍNAS SOBRE A PLATAFORMA CELLBE
spellingShingle COMPUTAÇÃO PARALELA NA CLASSIFICAÇÃO DE PROTEÍNAS SOBRE A PLATAFORMA CELLBE
Schuenemann, Hermann Pimentel
algoritmo de classificação de sequências
processador multi-núcleo
bioinformática
CellBE
Computação paralela
title_short COMPUTAÇÃO PARALELA NA CLASSIFICAÇÃO DE PROTEÍNAS SOBRE A PLATAFORMA CELLBE
title_full COMPUTAÇÃO PARALELA NA CLASSIFICAÇÃO DE PROTEÍNAS SOBRE A PLATAFORMA CELLBE
title_fullStr COMPUTAÇÃO PARALELA NA CLASSIFICAÇÃO DE PROTEÍNAS SOBRE A PLATAFORMA CELLBE
title_full_unstemmed COMPUTAÇÃO PARALELA NA CLASSIFICAÇÃO DE PROTEÍNAS SOBRE A PLATAFORMA CELLBE
title_sort COMPUTAÇÃO PARALELA NA CLASSIFICAÇÃO DE PROTEÍNAS SOBRE A PLATAFORMA CELLBE
author Schuenemann, Hermann Pimentel
author_facet Schuenemann, Hermann Pimentel
author_role author
dc.contributor.none.fl_str_mv Calha, Mário
Calha, Mário
Repositório da Universidade de Lisboa
dc.contributor.author.fl_str_mv Schuenemann, Hermann Pimentel
dc.subject.por.fl_str_mv algoritmo de classificação de sequências
processador multi-núcleo
bioinformática
CellBE
Computação paralela
topic algoritmo de classificação de sequências
processador multi-núcleo
bioinformática
CellBE
Computação paralela
description Um dos problemas maiores da bioinformática é a previsão de função de uma proteína. A tecnologia existente já permite obter milhões e milhões de sequências a custo muito reduzido, mas a compreensão de sua função dentro dos vários organismos é ainda um grande mistério para a larga maioria de sequências proteicas existentes. A criação de software eficiente que permita analisar bases de dados de proteínas em busca de metadados é também um desafio para os biólogos e uma área de estudo recente para os cientistas da computação, por representar uma alternativa de baixo custo aos métodos de teste em laboratório. Uma metodologia que se propõe analisar estas bases de dados e anotar as proteínas são os Peptide Programs (PepProg), uma metodologia de aprendizagem automática (machine learning) para classificação funcional de sequências biológicas. Esta dissertação de mestrado se propôs a estudar meios de optimizar o desempenho da implementação existente do método PepProg através da construção de uma implementação alternativa que explore a arquitectura do processador CellBE, presente nas consolas Playstation 3 disponibilizadas pelo Departamento de Informática da Universidade de Lisboa. Para explorar os recursos do CellBE, foi necessário primeiro modificar a implementação existente do método PepProg para que pudesse correr instruções do tipo Single Instruction Multiple Data (SIMD). Esta modificação denominada vectorização, é necessária para que os múltiplos núcleos do processador CellBE pudessem ser utilizados, transformando o PepProg num algoritmo paralelo dentro da arquitectura CellBE. Com o estudo realizado, pode-se concluir que as propostas de vectorização sugeridas nesta dissertação não foram suficientes para a construção de um PepProg paralelo mais eficiente, pois o custo da vectorização do algoritmo em tempo de execução provou-se ser tão alto a ponto de não poder ser compensado pela paralelização do algoritmo.
publishDate 2010
dc.date.none.fl_str_mv 2010-11-30T11:02:54Z
2010
2010-01-01T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10451/13911
url http://hdl.handle.net/10451/13911
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799134257555177472