Arquitetura de software para recuperaçao de falhas utilizando checkpointing quase-sincrono
Autor(a) principal: | |
---|---|
Data de Publicação: | 2005 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
Texto Completo: | https://hdl.handle.net/20.500.12733/1602738 |
Resumo: | Orientadores: Islene Calciolari Garcia |
id |
UNICAMP-30_6b14aa0c74330b42ea8f392a0990b426 |
---|---|
oai_identifier_str |
oai::368507 |
network_acronym_str |
UNICAMP-30 |
network_name_str |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
repository_id_str |
|
spelling |
Arquitetura de software para recuperaçao de falhas utilizando checkpointing quase-sincronoSoftware architecture for fault-recovery using quasi-synchronous checkpointingTolerância à falha (Computação)Processamento eletrônico de dados - Processamento distribuídoAlgoritmosFault-tolerant computingDistributed processingAlgorithmsOrientadores: Islene Calciolari GarciaDissertação (mestrado) - Universidade Estadual de Campinas, Instituto de ComputaçãoResumo: Um sistema distribuído tolerante a falhas que utilize recuperação por retrocesso de estado deve selecionar os checkpoints dos seus processos que serão gravados. Além dessa seleção, definida por um protocolo de checkpointing, o sistema precisa realizar uma coleta de lixo, para eliminar os checkpoints que se tornam obsoletos à medida que a aplicação executa. Assim, na ocorrência de uma falha, a computação pode ser retrocedida para um estado consistente salvo anteriormente. Esta dissertação discute os aspectos teóricos e práticos de um sistema distribuído tolerante a falhas que utiliza protocolos de checkpointing quase-síncronos e algoritmos para a coleta de lixo e recuperação por retrocesso. Existem vários protocolos de checkpointing na literatura, e nesta dissertação foram estudados os protocolos de checkpointing quase-síncronos. Esses protocols enviam informações de controle juntamente com as mensagens da aplicação, e podem exigir a gravação de checkpoints forçados, mas não necessitam de sincronização ou troca de mensagens de controle entre os processos. Com base nesse estudo, um framework para protocolos de checkpointing quase-sincronos foi implementado numa biblioteca de troca de mensagens chamada LAM/MPI. Além disso, uma arquitetura de software para recuperação de falhas por retrocesso de estado chamada Curupira também foi estudada e implementada naquela biblioteca. O Curupira_e a primeira arquitetura de software que n~ao precisa de troca de mensagens de controle ou qualquer sincronização entre os processos na execução dos protocolos de checkpointing e de coleta de lixoAbstract: A fault-tolerant distributed system based on rollback-recovery has to checkpoints of its processes are stored. Besides this selection, that is controlled checkpointing protocol, the system has to do garbage collection, in order to eliminate that become obsolete while the application executes. The garbage collection because checkpoints require the use of storage resources and the storage has limited capacity. So, when some fault occurs, the whole distributed be restored to a consistent global state previously stored. This dissertation practical and theoretical aspects of a fault-tolerant distributed system quasisynchronous checkpointing protocols and also garbage collection and algorithms. There are several checkpointing protocols proposed in the literature, quasisynchronous ones were studied in this dissertation. These protocols information in the application's messages and can induce forced checkpoints, need any synchronization or exchanging of control messages among on that study, a framework for quasi-synchronous checkpointing implemented in a message passing library called LAM/MPI. Moreover, a based on rollback-recovery from faults named Curupira was also implemented in that library. Curupira is the _rst software architecture exchanging of control messages or any synchronization among the execution of the checkpointing and garbage collection protocolsMestradoSistemas DistribuídosMestre em Ciência da Computação[s.n.]Garcia, Islene Calciolari, 1971-Caceres, EdsonMadeira, Edmundo Roberto MauroUniversidade Estadual de Campinas. Instituto de ComputaçãoPrograma de Pós-Graduação não informadoUNIVERSIDADE ESTADUAL DE CAMPINASSilva, Ulisses Furquim Freire da20052005-05-05T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdf99p. : il.(Broch.)https://hdl.handle.net/20.500.12733/1602738SILVA, Ulisses Furquim Freire da. Arquitetura de software para recuperaçao de falhas utilizando checkpointing quase-sincrono. 2005. 99p. Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1602738. Acesso em: 14 mai. 2024.https://repositorio.unicamp.br/acervo/detalhe/368507porreponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)instname:Universidade Estadual de Campinas (UNICAMP)instacron:UNICAMPinfo:eu-repo/semantics/openAccess2017-02-18T04:32:39Zoai::368507Biblioteca Digital de Teses e DissertaçõesPUBhttp://repositorio.unicamp.br/oai/tese/oai.aspsbubd@unicamp.bropendoar:2017-02-18T04:32:39Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)false |
dc.title.none.fl_str_mv |
Arquitetura de software para recuperaçao de falhas utilizando checkpointing quase-sincrono Software architecture for fault-recovery using quasi-synchronous checkpointing |
title |
Arquitetura de software para recuperaçao de falhas utilizando checkpointing quase-sincrono |
spellingShingle |
Arquitetura de software para recuperaçao de falhas utilizando checkpointing quase-sincrono Silva, Ulisses Furquim Freire da Tolerância à falha (Computação) Processamento eletrônico de dados - Processamento distribuído Algoritmos Fault-tolerant computing Distributed processing Algorithms |
title_short |
Arquitetura de software para recuperaçao de falhas utilizando checkpointing quase-sincrono |
title_full |
Arquitetura de software para recuperaçao de falhas utilizando checkpointing quase-sincrono |
title_fullStr |
Arquitetura de software para recuperaçao de falhas utilizando checkpointing quase-sincrono |
title_full_unstemmed |
Arquitetura de software para recuperaçao de falhas utilizando checkpointing quase-sincrono |
title_sort |
Arquitetura de software para recuperaçao de falhas utilizando checkpointing quase-sincrono |
author |
Silva, Ulisses Furquim Freire da |
author_facet |
Silva, Ulisses Furquim Freire da |
author_role |
author |
dc.contributor.none.fl_str_mv |
Garcia, Islene Calciolari, 1971- Caceres, Edson Madeira, Edmundo Roberto Mauro Universidade Estadual de Campinas. Instituto de Computação Programa de Pós-Graduação não informado UNIVERSIDADE ESTADUAL DE CAMPINAS |
dc.contributor.author.fl_str_mv |
Silva, Ulisses Furquim Freire da |
dc.subject.por.fl_str_mv |
Tolerância à falha (Computação) Processamento eletrônico de dados - Processamento distribuído Algoritmos Fault-tolerant computing Distributed processing Algorithms |
topic |
Tolerância à falha (Computação) Processamento eletrônico de dados - Processamento distribuído Algoritmos Fault-tolerant computing Distributed processing Algorithms |
description |
Orientadores: Islene Calciolari Garcia |
publishDate |
2005 |
dc.date.none.fl_str_mv |
2005 2005-05-05T00:00:00Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
(Broch.) https://hdl.handle.net/20.500.12733/1602738 SILVA, Ulisses Furquim Freire da. Arquitetura de software para recuperaçao de falhas utilizando checkpointing quase-sincrono. 2005. 99p. Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1602738. Acesso em: 14 mai. 2024. |
identifier_str_mv |
(Broch.) SILVA, Ulisses Furquim Freire da. Arquitetura de software para recuperaçao de falhas utilizando checkpointing quase-sincrono. 2005. 99p. Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1602738. Acesso em: 14 mai. 2024. |
url |
https://hdl.handle.net/20.500.12733/1602738 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
https://repositorio.unicamp.br/acervo/detalhe/368507 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf 99p. : il. |
dc.publisher.none.fl_str_mv |
[s.n.] |
publisher.none.fl_str_mv |
[s.n.] |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) instname:Universidade Estadual de Campinas (UNICAMP) instacron:UNICAMP |
instname_str |
Universidade Estadual de Campinas (UNICAMP) |
instacron_str |
UNICAMP |
institution |
UNICAMP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
collection |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP) |
repository.mail.fl_str_mv |
sbubd@unicamp.br |
_version_ |
1799138413298843648 |