Um ambiente computacional tolerante a falhas para aplicações paralelas

Detalhes bibliográficos
Autor(a) principal: Pinheiro, Oberdan Rocha
Data de Publicação: 2013
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório da Produção Científica e Intelectual do SENAI CIMATEC
Texto Completo: http://repositoriosenaiba.fieb.org.br/handle/fieb/749
Resumo: O desempenho computacional disponibilizado pelos sistemas paralelos resulta da capacidade de dividir o trabalho em partes menores e encaminhar cada uma delas para ser processada paralelamente em diferentes nós de um sistema distribuído. A falha em uma das partes paralelizadas pode levar a computação a um estado de operação inadequado, comprometendo o resultado final da computação paralela distribuída. Um sistema distribuído está sujeito a falhas nos seus componentes de comunicação, seus processadores, em suas aplicações entre outros componentes que formam o sistema. Desta maneira, as aplicações paralelas, ao utilizarem os recursos disponibilizados pelos sistemas distribuídos, têm suas partes executadas em paralelo, em diferentes nós desse sistema. Em razão de cada um desses recursos ser um possível ponto de falha, as aplicações paralelas acabam se tornando mais susceptíveis à ocorrência de falhas. Quando as aplicações paralelas são interrompidas durante a ocorrência de falhas, todo o processamento realizado e o tempo gasto para tal são desperdiçados, pois as aplicações devem ser reinicializadas. Dessa forma, o desenvolvimento de técnicas de tolerância a falhas torna-se fundamental, para garantir o término das aplicações paralelas. Este trabalho apresenta um ambiente computacional tolerante a falhas para aplicações paralelas que utilizam o padrão Open MPI, para minimizar o desperdício de tempo e processamento já realizados pelos processos da aplicação paralela, até o momento do surgimento da falha. O ambiente utiliza mecanismo de checkpoint/restart do padrão Open MPI para armazenar e recuperar os estados dos processos paralelos e a técnica de heartbeat para verificar a continuidade de execução destes mesmos processos.
id SENAI-1_34cc8d55b0a7e127d099d96fa82833bb
oai_identifier_str oai:repositoriosenaiba.fieb.org.br:fieb/749
network_acronym_str SENAI-1
network_name_str Repositório da Produção Científica e Intelectual do SENAI CIMATEC
repository_id_str
spelling Pinheiro, Oberdan RochaSouza, Josemar Rodrigues deDuarte, Ângelo AmâncioBarreto, Marcos EnnesPereira, Hernane Borges de Barros2016-09-28T17:01:56Z2013http://repositoriosenaiba.fieb.org.br/handle/fieb/749O desempenho computacional disponibilizado pelos sistemas paralelos resulta da capacidade de dividir o trabalho em partes menores e encaminhar cada uma delas para ser processada paralelamente em diferentes nós de um sistema distribuído. A falha em uma das partes paralelizadas pode levar a computação a um estado de operação inadequado, comprometendo o resultado final da computação paralela distribuída. Um sistema distribuído está sujeito a falhas nos seus componentes de comunicação, seus processadores, em suas aplicações entre outros componentes que formam o sistema. Desta maneira, as aplicações paralelas, ao utilizarem os recursos disponibilizados pelos sistemas distribuídos, têm suas partes executadas em paralelo, em diferentes nós desse sistema. Em razão de cada um desses recursos ser um possível ponto de falha, as aplicações paralelas acabam se tornando mais susceptíveis à ocorrência de falhas. Quando as aplicações paralelas são interrompidas durante a ocorrência de falhas, todo o processamento realizado e o tempo gasto para tal são desperdiçados, pois as aplicações devem ser reinicializadas. Dessa forma, o desenvolvimento de técnicas de tolerância a falhas torna-se fundamental, para garantir o término das aplicações paralelas. Este trabalho apresenta um ambiente computacional tolerante a falhas para aplicações paralelas que utilizam o padrão Open MPI, para minimizar o desperdício de tempo e processamento já realizados pelos processos da aplicação paralela, até o momento do surgimento da falha. O ambiente utiliza mecanismo de checkpoint/restart do padrão Open MPI para armazenar e recuperar os estados dos processos paralelos e a técnica de heartbeat para verificar a continuidade de execução destes mesmos processos.Faculdade de Tecnologia SENAI CIMATECFaculdade de Tecnologia SENAI CIMATECModelagem Computacional e Tecnologia IndustrialSENAI CIMATECbrasilFalha - TolerânciaCheckpoint - ProtocoloMPIUm ambiente computacional tolerante a falhas para aplicações paralelasinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisaberto2016-09-29T17:01:56Zinfo:eu-repo/semantics/openAccessporreponame:Repositório da Produção Científica e Intelectual do SENAI CIMATECinstname:Serviço Nacional de Aprendizagem Industrial Campus Integrado de Manufatura e Tecnologia (SENAI CIMATEC)instacron:SENAI CIMATECORIGINALDissertacao Oberdan Rocha Pinheiro.pdfDissertacao Oberdan Rocha Pinheiro.pdfapplication/pdf1325836http://repositoriosenaiba.fieb.org.br/bitstream/fieb/749/1/Dissertacao%20Oberdan%20Rocha%20Pinheiro.pdf07e085bffa3fd1d6d2e4db657f9061b1MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81748http://repositoriosenaiba.fieb.org.br/bitstream/fieb/749/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52fieb/7492016-09-28 14:01:56.883oai:repositoriosenaiba.fieb.org.br:fieb/749Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório de Publicaçõeshttp://repositoriosenaiba.fieb.org.br/oaiopendoar:2016-09-28T17:01:56Repositório da Produção Científica e Intelectual do SENAI CIMATEC - Serviço Nacional de Aprendizagem Industrial Campus Integrado de Manufatura e Tecnologia (SENAI CIMATEC)false
dc.title.pt_BR.fl_str_mv Um ambiente computacional tolerante a falhas para aplicações paralelas
title Um ambiente computacional tolerante a falhas para aplicações paralelas
spellingShingle Um ambiente computacional tolerante a falhas para aplicações paralelas
Pinheiro, Oberdan Rocha
Falha - Tolerância
Checkpoint - Protocolo
MPI
title_short Um ambiente computacional tolerante a falhas para aplicações paralelas
title_full Um ambiente computacional tolerante a falhas para aplicações paralelas
title_fullStr Um ambiente computacional tolerante a falhas para aplicações paralelas
title_full_unstemmed Um ambiente computacional tolerante a falhas para aplicações paralelas
title_sort Um ambiente computacional tolerante a falhas para aplicações paralelas
author Pinheiro, Oberdan Rocha
author_facet Pinheiro, Oberdan Rocha
author_role author
dc.contributor.author.fl_str_mv Pinheiro, Oberdan Rocha
dc.contributor.advisor1.fl_str_mv Souza, Josemar Rodrigues de
dc.contributor.referee1.fl_str_mv Duarte, Ângelo Amâncio
Barreto, Marcos Ennes
Pereira, Hernane Borges de Barros
contributor_str_mv Souza, Josemar Rodrigues de
Duarte, Ângelo Amâncio
Barreto, Marcos Ennes
Pereira, Hernane Borges de Barros
dc.subject.por.fl_str_mv Falha - Tolerância
Checkpoint - Protocolo
MPI
topic Falha - Tolerância
Checkpoint - Protocolo
MPI
description O desempenho computacional disponibilizado pelos sistemas paralelos resulta da capacidade de dividir o trabalho em partes menores e encaminhar cada uma delas para ser processada paralelamente em diferentes nós de um sistema distribuído. A falha em uma das partes paralelizadas pode levar a computação a um estado de operação inadequado, comprometendo o resultado final da computação paralela distribuída. Um sistema distribuído está sujeito a falhas nos seus componentes de comunicação, seus processadores, em suas aplicações entre outros componentes que formam o sistema. Desta maneira, as aplicações paralelas, ao utilizarem os recursos disponibilizados pelos sistemas distribuídos, têm suas partes executadas em paralelo, em diferentes nós desse sistema. Em razão de cada um desses recursos ser um possível ponto de falha, as aplicações paralelas acabam se tornando mais susceptíveis à ocorrência de falhas. Quando as aplicações paralelas são interrompidas durante a ocorrência de falhas, todo o processamento realizado e o tempo gasto para tal são desperdiçados, pois as aplicações devem ser reinicializadas. Dessa forma, o desenvolvimento de técnicas de tolerância a falhas torna-se fundamental, para garantir o término das aplicações paralelas. Este trabalho apresenta um ambiente computacional tolerante a falhas para aplicações paralelas que utilizam o padrão Open MPI, para minimizar o desperdício de tempo e processamento já realizados pelos processos da aplicação paralela, até o momento do surgimento da falha. O ambiente utiliza mecanismo de checkpoint/restart do padrão Open MPI para armazenar e recuperar os estados dos processos paralelos e a técnica de heartbeat para verificar a continuidade de execução destes mesmos processos.
publishDate 2013
dc.date.issued.fl_str_mv 2013
dc.date.accessioned.fl_str_mv 2016-09-28T17:01:56Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://repositoriosenaiba.fieb.org.br/handle/fieb/749
url http://repositoriosenaiba.fieb.org.br/handle/fieb/749
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Faculdade de Tecnologia SENAI CIMATEC
Faculdade de Tecnologia SENAI CIMATEC
dc.publisher.program.fl_str_mv Modelagem Computacional e Tecnologia Industrial
dc.publisher.initials.fl_str_mv SENAI CIMATEC
dc.publisher.country.fl_str_mv brasil
publisher.none.fl_str_mv Faculdade de Tecnologia SENAI CIMATEC
Faculdade de Tecnologia SENAI CIMATEC
dc.source.none.fl_str_mv reponame:Repositório da Produção Científica e Intelectual do SENAI CIMATEC
instname:Serviço Nacional de Aprendizagem Industrial Campus Integrado de Manufatura e Tecnologia (SENAI CIMATEC)
instacron:SENAI CIMATEC
instname_str Serviço Nacional de Aprendizagem Industrial Campus Integrado de Manufatura e Tecnologia (SENAI CIMATEC)
instacron_str SENAI CIMATEC
institution SENAI CIMATEC
reponame_str Repositório da Produção Científica e Intelectual do SENAI CIMATEC
collection Repositório da Produção Científica e Intelectual do SENAI CIMATEC
bitstream.url.fl_str_mv http://repositoriosenaiba.fieb.org.br/bitstream/fieb/749/1/Dissertacao%20Oberdan%20Rocha%20Pinheiro.pdf
http://repositoriosenaiba.fieb.org.br/bitstream/fieb/749/2/license.txt
bitstream.checksum.fl_str_mv 07e085bffa3fd1d6d2e4db657f9061b1
8a4605be74aa9ea9d79846c1fba20a33
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório da Produção Científica e Intelectual do SENAI CIMATEC - Serviço Nacional de Aprendizagem Industrial Campus Integrado de Manufatura e Tecnologia (SENAI CIMATEC)
repository.mail.fl_str_mv
_version_ 1813184713685204992