Arquitetura de software para recuperaçao de falhas utilizando checkpointing quase-sincrono

Detalhes bibliográficos
Autor(a) principal: Silva, Ulisses Furquim Freire da
Data de Publicação: 2005
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
Texto Completo: https://hdl.handle.net/20.500.12733/1602738
Resumo: Orientadores: Islene Calciolari Garcia
id UNICAMP-30_6b14aa0c74330b42ea8f392a0990b426
oai_identifier_str oai::368507
network_acronym_str UNICAMP-30
network_name_str Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
repository_id_str
spelling Arquitetura de software para recuperaçao de falhas utilizando checkpointing quase-sincronoSoftware architecture for fault-recovery using quasi-synchronous checkpointingTolerância à falha (Computação)Processamento eletrônico de dados - Processamento distribuídoAlgoritmosFault-tolerant computingDistributed processingAlgorithmsOrientadores: Islene Calciolari GarciaDissertação (mestrado) - Universidade Estadual de Campinas, Instituto de ComputaçãoResumo: Um sistema distribuído tolerante a falhas que utilize recuperação por retrocesso de estado deve selecionar os checkpoints dos seus processos que serão gravados. Além dessa seleção, definida por um protocolo de checkpointing, o sistema precisa realizar uma coleta de lixo, para eliminar os checkpoints que se tornam obsoletos à medida que a aplicação executa. Assim, na ocorrência de uma falha, a computação pode ser retrocedida para um estado consistente salvo anteriormente. Esta dissertação discute os aspectos teóricos e práticos de um sistema distribuído tolerante a falhas que utiliza protocolos de checkpointing quase-síncronos e algoritmos para a coleta de lixo e recuperação por retrocesso. Existem vários protocolos de checkpointing na literatura, e nesta dissertação foram estudados os protocolos de checkpointing quase-síncronos. Esses protocols enviam informações de controle juntamente com as mensagens da aplicação, e podem exigir a gravação de checkpoints forçados, mas não necessitam de sincronização ou troca de mensagens de controle entre os processos. Com base nesse estudo, um framework para protocolos de checkpointing quase-sincronos foi implementado numa biblioteca de troca de mensagens chamada LAM/MPI. Além disso, uma arquitetura de software para recuperação de falhas por retrocesso de estado chamada Curupira também foi estudada e implementada naquela biblioteca. O Curupira_e a primeira arquitetura de software que n~ao precisa de troca de mensagens de controle ou qualquer sincronização entre os processos na execução dos protocolos de checkpointing e de coleta de lixoAbstract: A fault-tolerant distributed system based on rollback-recovery has to checkpoints of its processes are stored. Besides this selection, that is controlled checkpointing protocol, the system has to do garbage collection, in order to eliminate that become obsolete while the application executes. The garbage collection because checkpoints require the use of storage resources and the storage has limited capacity. So, when some fault occurs, the whole distributed be restored to a consistent global state previously stored. This dissertation practical and theoretical aspects of a fault-tolerant distributed system quasisynchronous checkpointing protocols and also garbage collection and algorithms. There are several checkpointing protocols proposed in the literature, quasisynchronous ones were studied in this dissertation. These protocols information in the application's messages and can induce forced checkpoints, need any synchronization or exchanging of control messages among on that study, a framework for quasi-synchronous checkpointing implemented in a message passing library called LAM/MPI. Moreover, a based on rollback-recovery from faults named Curupira was also implemented in that library. Curupira is the _rst software architecture exchanging of control messages or any synchronization among the execution of the checkpointing and garbage collection protocolsMestradoSistemas DistribuídosMestre em Ciência da Computação[s.n.]Garcia, Islene Calciolari, 1971-Caceres, EdsonMadeira, Edmundo Roberto MauroUniversidade Estadual de Campinas. Instituto de ComputaçãoPrograma de Pós-Graduação não informadoUNIVERSIDADE ESTADUAL DE CAMPINASSilva, Ulisses Furquim Freire da20052005-05-05T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdf99p. : il.(Broch.)https://hdl.handle.net/20.500.12733/1602738SILVA, Ulisses Furquim Freire da. Arquitetura de software para recuperaçao de falhas utilizando checkpointing quase-sincrono. 2005. 99p. Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1602738. Acesso em: 14 mai. 2024.https://repositorio.unicamp.br/acervo/detalhe/368507porreponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)instname:Universidade Estadual de Campinas (UNICAMP)instacron:UNICAMPinfo:eu-repo/semantics/openAccess2017-02-18T04:32:39Zoai::368507Biblioteca Digital de Teses e DissertaçõesPUBhttp://repositorio.unicamp.br/oai/tese/oai.aspsbubd@unicamp.bropendoar:2017-02-18T04:32:39Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)false
dc.title.none.fl_str_mv Arquitetura de software para recuperaçao de falhas utilizando checkpointing quase-sincrono
Software architecture for fault-recovery using quasi-synchronous checkpointing
title Arquitetura de software para recuperaçao de falhas utilizando checkpointing quase-sincrono
spellingShingle Arquitetura de software para recuperaçao de falhas utilizando checkpointing quase-sincrono
Silva, Ulisses Furquim Freire da
Tolerância à falha (Computação)
Processamento eletrônico de dados - Processamento distribuído
Algoritmos
Fault-tolerant computing
Distributed processing
Algorithms
title_short Arquitetura de software para recuperaçao de falhas utilizando checkpointing quase-sincrono
title_full Arquitetura de software para recuperaçao de falhas utilizando checkpointing quase-sincrono
title_fullStr Arquitetura de software para recuperaçao de falhas utilizando checkpointing quase-sincrono
title_full_unstemmed Arquitetura de software para recuperaçao de falhas utilizando checkpointing quase-sincrono
title_sort Arquitetura de software para recuperaçao de falhas utilizando checkpointing quase-sincrono
author Silva, Ulisses Furquim Freire da
author_facet Silva, Ulisses Furquim Freire da
author_role author
dc.contributor.none.fl_str_mv Garcia, Islene Calciolari, 1971-
Caceres, Edson
Madeira, Edmundo Roberto Mauro
Universidade Estadual de Campinas. Instituto de Computação
Programa de Pós-Graduação não informado
UNIVERSIDADE ESTADUAL DE CAMPINAS
dc.contributor.author.fl_str_mv Silva, Ulisses Furquim Freire da
dc.subject.por.fl_str_mv Tolerância à falha (Computação)
Processamento eletrônico de dados - Processamento distribuído
Algoritmos
Fault-tolerant computing
Distributed processing
Algorithms
topic Tolerância à falha (Computação)
Processamento eletrônico de dados - Processamento distribuído
Algoritmos
Fault-tolerant computing
Distributed processing
Algorithms
description Orientadores: Islene Calciolari Garcia
publishDate 2005
dc.date.none.fl_str_mv 2005
2005-05-05T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv (Broch.)
https://hdl.handle.net/20.500.12733/1602738
SILVA, Ulisses Furquim Freire da. Arquitetura de software para recuperaçao de falhas utilizando checkpointing quase-sincrono. 2005. 99p. Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1602738. Acesso em: 14 mai. 2024.
identifier_str_mv (Broch.)
SILVA, Ulisses Furquim Freire da. Arquitetura de software para recuperaçao de falhas utilizando checkpointing quase-sincrono. 2005. 99p. Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1602738. Acesso em: 14 mai. 2024.
url https://hdl.handle.net/20.500.12733/1602738
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv https://repositorio.unicamp.br/acervo/detalhe/368507
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
99p. : il.
dc.publisher.none.fl_str_mv [s.n.]
publisher.none.fl_str_mv [s.n.]
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
instname:Universidade Estadual de Campinas (UNICAMP)
instacron:UNICAMP
instname_str Universidade Estadual de Campinas (UNICAMP)
instacron_str UNICAMP
institution UNICAMP
reponame_str Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
collection Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)
repository.mail.fl_str_mv sbubd@unicamp.br
_version_ 1799138413298843648