p2pBIOFOCO : um framework Peer-to-Peer para processamento distribuido do BLAST

Detalhes bibliográficos
Autor(a) principal: Ribeiro, Edward de Oliveira
Data de Publicação: 2006
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UnB
Texto Completo: http://repositorio.unb.br/handle/10482/3093
Resumo: Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2006.
id UNB_fbfe24e29cca6492c1a0d6446d1180de
oai_identifier_str oai:repositorio.unb.br:10482/3093
network_acronym_str UNB
network_name_str Repositório Institucional da UnB
repository_id_str
spelling p2pBIOFOCO : um framework Peer-to-Peer para processamento distribuido do BLASTProcessamento eletrônico de dados - processamento distribuídoBiologia computacionalDissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2006.Uma área promissora para o projeto e desenvolvimento de sistemas distribuídos tem sido a Bioinformática, um campo de pesquisa interdisciplinar que usa conhecimentos de Ciência da Computação, Matemática e Estatística para resolver problemas de Biologia Molecular. Entretanto, apesar do amplo desenvolvimento e uso de tecnologias distribuídas no comércio, indústria e meio acadêmico, os sistemas distribuídos baseados no modelo Peer-to-Peer (P2P) ainda permanecem relativamente inexplorados no campo científico. Nesta dissertação, propomos uma nova arquitetura distribuída para a execução de aplicações em Bioinformática, particularmente o BLAST (Basic Local Alignment Search Tool), utilizando o modelo P2P. O BLAST é uma família de ferramentas que identifica a similaridade entre seqüências de DNA ou RNA fornecidas pelo usuário e seqüências existentes em bancos de dados de aminoácidos e nucleotídeos. Neste trabalho, projetamos e desenvolvemos um framework, baseado na plataforma P2P JXTA, para distribuir o processamento do BLAST entre dois ou mais domínios remotos utilizando um algoritmo de escalonamento de tarefas do tipo "alternância circular" (round robin) em uma rede privada virtual. O sistema conta ainda com um mecanismo de presença para anunciar o estado (ativo/inativo) dos Peers, e a flexibilidade de adicionar e remover serviços de forma dinâmica, isto é, sem a necessidade de reiniciar a aplicação. Os resultados do processamento do BLAST foram armazenados em um diretório FTP através de uma conexão segura. O banco de dados utilizado pelo BLAST foi o nr, o maior banco de dados de nucleotídeos disponível no National Center for Biotechnology Information (NCBI). Analisamos os ganhos reais de execução de arquivos contendo seqüências de DNA em 10 máquinas, distribuídas entre três domínios remotos, de forma a verificar a aplicabilidade da abordagem P2P em um ambiente de testes real, e o impacto que as limitações de memória RAM de cada máquina exerce sobre o tempo de execução total do sistema. Os bons resultados obtidos motivam novas melhorias no modelo atual, como inclusão de novos algoritmos de escalonamento de tarefas ou mecanismos de tolerância a falhas, além do uso desta arquitetura em projetos reais de Bioinformática. ___________________________________________________________________________________________ ABSTRACTA rewarding area for the project and design of distributed systems has been Bioinformatics, an interdisciplinary research field that uses knowledge from Computer Science, Mathematics and Statistics to solve problems in Molecular Biology. Nevertheless, in spite of the development and use of distributed technologies in business, industry and academia, distributed systems based on the Peer-to- Peer (P2P) model are still relatively unexplored in the scientific field. In this dissertation, we propose a new distributed architecture to the execution of Bioinformatics applications, particularly the BLAST (Basic Local Alignment Search Tool), using a P2P computing model. The BLAST is a suite of tools that verify the similarity between DNA or RNA sequences issued by the user and the sequences stored in nucleotides and aminoacids databases. In this work, we designed and developed a framework, based on JXTA P2P platform, to distribute BLAST processing among two or more remote sites according to a round robin task-scheduling algorithm in a virtual private network. The system has also a presence mechanism to advertise the status of the Peers (online/offline), and the flexibility to dynamically add or remove services, that is, without restarting the application. The results of the BLAST processing were stored in a FTP directory through a secure connection. The database used by BLAST was nr, the largest nucleotide database available at the National Center for Biotechnology Information (NCBI). We analyzed the real gains of the execution of DNA sequence files in 10 machines, distributed among three remote sites, to verify the applicability of the P2P approach in a real testbed environment, and the impact that RAM memory limitations of each machine has over the total execution time of the system. The good results obtained motivate us new improvements in the current model, like the inclusion of new task scheduling algorithms or fault tolerance mechanisms, and the use of this architecture in real Bioinformatics projects.Walter, Maria Emília Machado TellesRibeiro, Edward de Oliveira2010-01-11T16:46:22Z2010-01-11T16:46:22Z2010-01-112006-03-27info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfRIBEIRO, Edward de Oliveira. p2pBIOFOCO: um framework Peer-to-Peer para processamento distribuido do BLAST. 2006. 92 f. Dissertação (Mestrado em Informática)-Universidade de Brasília, Brasília, 2006.http://repositorio.unb.br/handle/10482/3093info:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UnBinstname:Universidade de Brasília (UnB)instacron:UNB2023-07-14T18:56:22Zoai:repositorio.unb.br:10482/3093Repositório InstitucionalPUBhttps://repositorio.unb.br/oai/requestrepositorio@unb.bropendoar:2023-07-14T18:56:22Repositório Institucional da UnB - Universidade de Brasília (UnB)false
dc.title.none.fl_str_mv p2pBIOFOCO : um framework Peer-to-Peer para processamento distribuido do BLAST
title p2pBIOFOCO : um framework Peer-to-Peer para processamento distribuido do BLAST
spellingShingle p2pBIOFOCO : um framework Peer-to-Peer para processamento distribuido do BLAST
Ribeiro, Edward de Oliveira
Processamento eletrônico de dados - processamento distribuído
Biologia computacional
title_short p2pBIOFOCO : um framework Peer-to-Peer para processamento distribuido do BLAST
title_full p2pBIOFOCO : um framework Peer-to-Peer para processamento distribuido do BLAST
title_fullStr p2pBIOFOCO : um framework Peer-to-Peer para processamento distribuido do BLAST
title_full_unstemmed p2pBIOFOCO : um framework Peer-to-Peer para processamento distribuido do BLAST
title_sort p2pBIOFOCO : um framework Peer-to-Peer para processamento distribuido do BLAST
author Ribeiro, Edward de Oliveira
author_facet Ribeiro, Edward de Oliveira
author_role author
dc.contributor.none.fl_str_mv Walter, Maria Emília Machado Telles
dc.contributor.author.fl_str_mv Ribeiro, Edward de Oliveira
dc.subject.por.fl_str_mv Processamento eletrônico de dados - processamento distribuído
Biologia computacional
topic Processamento eletrônico de dados - processamento distribuído
Biologia computacional
description Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2006.
publishDate 2006
dc.date.none.fl_str_mv 2006-03-27
2010-01-11T16:46:22Z
2010-01-11T16:46:22Z
2010-01-11
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv RIBEIRO, Edward de Oliveira. p2pBIOFOCO: um framework Peer-to-Peer para processamento distribuido do BLAST. 2006. 92 f. Dissertação (Mestrado em Informática)-Universidade de Brasília, Brasília, 2006.
http://repositorio.unb.br/handle/10482/3093
identifier_str_mv RIBEIRO, Edward de Oliveira. p2pBIOFOCO: um framework Peer-to-Peer para processamento distribuido do BLAST. 2006. 92 f. Dissertação (Mestrado em Informática)-Universidade de Brasília, Brasília, 2006.
url http://repositorio.unb.br/handle/10482/3093
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UnB
instname:Universidade de Brasília (UnB)
instacron:UNB
instname_str Universidade de Brasília (UnB)
instacron_str UNB
institution UNB
reponame_str Repositório Institucional da UnB
collection Repositório Institucional da UnB
repository.name.fl_str_mv Repositório Institucional da UnB - Universidade de Brasília (UnB)
repository.mail.fl_str_mv repositorio@unb.br
_version_ 1810580823548624896