Um ambiente computacional tolerante a falhas para aplicações paralelas
Autor(a) principal: | |
---|---|
Data de Publicação: | 2013 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório da Produção Científica e Intelectual do SENAI CIMATEC |
Texto Completo: | http://repositoriosenaiba.fieb.org.br/handle/fieb/749 |
Resumo: | O desempenho computacional disponibilizado pelos sistemas paralelos resulta da capacidade de dividir o trabalho em partes menores e encaminhar cada uma delas para ser processada paralelamente em diferentes nós de um sistema distribuído. A falha em uma das partes paralelizadas pode levar a computação a um estado de operação inadequado, comprometendo o resultado final da computação paralela distribuída. Um sistema distribuído está sujeito a falhas nos seus componentes de comunicação, seus processadores, em suas aplicações entre outros componentes que formam o sistema. Desta maneira, as aplicações paralelas, ao utilizarem os recursos disponibilizados pelos sistemas distribuídos, têm suas partes executadas em paralelo, em diferentes nós desse sistema. Em razão de cada um desses recursos ser um possível ponto de falha, as aplicações paralelas acabam se tornando mais susceptíveis à ocorrência de falhas. Quando as aplicações paralelas são interrompidas durante a ocorrência de falhas, todo o processamento realizado e o tempo gasto para tal são desperdiçados, pois as aplicações devem ser reinicializadas. Dessa forma, o desenvolvimento de técnicas de tolerância a falhas torna-se fundamental, para garantir o término das aplicações paralelas. Este trabalho apresenta um ambiente computacional tolerante a falhas para aplicações paralelas que utilizam o padrão Open MPI, para minimizar o desperdício de tempo e processamento já realizados pelos processos da aplicação paralela, até o momento do surgimento da falha. O ambiente utiliza mecanismo de checkpoint/restart do padrão Open MPI para armazenar e recuperar os estados dos processos paralelos e a técnica de heartbeat para verificar a continuidade de execução destes mesmos processos. |
id |
SENAI-1_34cc8d55b0a7e127d099d96fa82833bb |
---|---|
oai_identifier_str |
oai:repositoriosenaiba.fieb.org.br:fieb/749 |
network_acronym_str |
SENAI-1 |
network_name_str |
Repositório da Produção Científica e Intelectual do SENAI CIMATEC |
repository_id_str |
|
spelling |
Pinheiro, Oberdan RochaSouza, Josemar Rodrigues deDuarte, Ângelo AmâncioBarreto, Marcos EnnesPereira, Hernane Borges de Barros2016-09-28T17:01:56Z2013http://repositoriosenaiba.fieb.org.br/handle/fieb/749O desempenho computacional disponibilizado pelos sistemas paralelos resulta da capacidade de dividir o trabalho em partes menores e encaminhar cada uma delas para ser processada paralelamente em diferentes nós de um sistema distribuído. A falha em uma das partes paralelizadas pode levar a computação a um estado de operação inadequado, comprometendo o resultado final da computação paralela distribuída. Um sistema distribuído está sujeito a falhas nos seus componentes de comunicação, seus processadores, em suas aplicações entre outros componentes que formam o sistema. Desta maneira, as aplicações paralelas, ao utilizarem os recursos disponibilizados pelos sistemas distribuídos, têm suas partes executadas em paralelo, em diferentes nós desse sistema. Em razão de cada um desses recursos ser um possível ponto de falha, as aplicações paralelas acabam se tornando mais susceptíveis à ocorrência de falhas. Quando as aplicações paralelas são interrompidas durante a ocorrência de falhas, todo o processamento realizado e o tempo gasto para tal são desperdiçados, pois as aplicações devem ser reinicializadas. Dessa forma, o desenvolvimento de técnicas de tolerância a falhas torna-se fundamental, para garantir o término das aplicações paralelas. Este trabalho apresenta um ambiente computacional tolerante a falhas para aplicações paralelas que utilizam o padrão Open MPI, para minimizar o desperdício de tempo e processamento já realizados pelos processos da aplicação paralela, até o momento do surgimento da falha. O ambiente utiliza mecanismo de checkpoint/restart do padrão Open MPI para armazenar e recuperar os estados dos processos paralelos e a técnica de heartbeat para verificar a continuidade de execução destes mesmos processos.Faculdade de Tecnologia SENAI CIMATECFaculdade de Tecnologia SENAI CIMATECModelagem Computacional e Tecnologia IndustrialSENAI CIMATECbrasilFalha - TolerânciaCheckpoint - ProtocoloMPIUm ambiente computacional tolerante a falhas para aplicações paralelasinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisaberto2016-09-29T17:01:56Zinfo:eu-repo/semantics/openAccessporreponame:Repositório da Produção Científica e Intelectual do SENAI CIMATECinstname:Serviço Nacional de Aprendizagem Industrial Campus Integrado de Manufatura e Tecnologia (SENAI CIMATEC)instacron:SENAI CIMATECORIGINALDissertacao Oberdan Rocha Pinheiro.pdfDissertacao Oberdan Rocha Pinheiro.pdfapplication/pdf1325836http://repositoriosenaiba.fieb.org.br/bitstream/fieb/749/1/Dissertacao%20Oberdan%20Rocha%20Pinheiro.pdf07e085bffa3fd1d6d2e4db657f9061b1MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81748http://repositoriosenaiba.fieb.org.br/bitstream/fieb/749/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52fieb/7492016-09-28 14:01:56.883oai:repositoriosenaiba.fieb.org.br:fieb/749Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório de Publicaçõeshttp://repositoriosenaiba.fieb.org.br/oaiopendoar:2016-09-28T17:01:56Repositório da Produção Científica e Intelectual do SENAI CIMATEC - Serviço Nacional de Aprendizagem Industrial Campus Integrado de Manufatura e Tecnologia (SENAI CIMATEC)false |
dc.title.pt_BR.fl_str_mv |
Um ambiente computacional tolerante a falhas para aplicações paralelas |
title |
Um ambiente computacional tolerante a falhas para aplicações paralelas |
spellingShingle |
Um ambiente computacional tolerante a falhas para aplicações paralelas Pinheiro, Oberdan Rocha Falha - Tolerância Checkpoint - Protocolo MPI |
title_short |
Um ambiente computacional tolerante a falhas para aplicações paralelas |
title_full |
Um ambiente computacional tolerante a falhas para aplicações paralelas |
title_fullStr |
Um ambiente computacional tolerante a falhas para aplicações paralelas |
title_full_unstemmed |
Um ambiente computacional tolerante a falhas para aplicações paralelas |
title_sort |
Um ambiente computacional tolerante a falhas para aplicações paralelas |
author |
Pinheiro, Oberdan Rocha |
author_facet |
Pinheiro, Oberdan Rocha |
author_role |
author |
dc.contributor.author.fl_str_mv |
Pinheiro, Oberdan Rocha |
dc.contributor.advisor1.fl_str_mv |
Souza, Josemar Rodrigues de |
dc.contributor.referee1.fl_str_mv |
Duarte, Ângelo Amâncio Barreto, Marcos Ennes Pereira, Hernane Borges de Barros |
contributor_str_mv |
Souza, Josemar Rodrigues de Duarte, Ângelo Amâncio Barreto, Marcos Ennes Pereira, Hernane Borges de Barros |
dc.subject.por.fl_str_mv |
Falha - Tolerância Checkpoint - Protocolo MPI |
topic |
Falha - Tolerância Checkpoint - Protocolo MPI |
description |
O desempenho computacional disponibilizado pelos sistemas paralelos resulta da capacidade de dividir o trabalho em partes menores e encaminhar cada uma delas para ser processada paralelamente em diferentes nós de um sistema distribuído. A falha em uma das partes paralelizadas pode levar a computação a um estado de operação inadequado, comprometendo o resultado final da computação paralela distribuída. Um sistema distribuído está sujeito a falhas nos seus componentes de comunicação, seus processadores, em suas aplicações entre outros componentes que formam o sistema. Desta maneira, as aplicações paralelas, ao utilizarem os recursos disponibilizados pelos sistemas distribuídos, têm suas partes executadas em paralelo, em diferentes nós desse sistema. Em razão de cada um desses recursos ser um possível ponto de falha, as aplicações paralelas acabam se tornando mais susceptíveis à ocorrência de falhas. Quando as aplicações paralelas são interrompidas durante a ocorrência de falhas, todo o processamento realizado e o tempo gasto para tal são desperdiçados, pois as aplicações devem ser reinicializadas. Dessa forma, o desenvolvimento de técnicas de tolerância a falhas torna-se fundamental, para garantir o término das aplicações paralelas. Este trabalho apresenta um ambiente computacional tolerante a falhas para aplicações paralelas que utilizam o padrão Open MPI, para minimizar o desperdício de tempo e processamento já realizados pelos processos da aplicação paralela, até o momento do surgimento da falha. O ambiente utiliza mecanismo de checkpoint/restart do padrão Open MPI para armazenar e recuperar os estados dos processos paralelos e a técnica de heartbeat para verificar a continuidade de execução destes mesmos processos. |
publishDate |
2013 |
dc.date.issued.fl_str_mv |
2013 |
dc.date.accessioned.fl_str_mv |
2016-09-28T17:01:56Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://repositoriosenaiba.fieb.org.br/handle/fieb/749 |
url |
http://repositoriosenaiba.fieb.org.br/handle/fieb/749 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Faculdade de Tecnologia SENAI CIMATEC Faculdade de Tecnologia SENAI CIMATEC |
dc.publisher.program.fl_str_mv |
Modelagem Computacional e Tecnologia Industrial |
dc.publisher.initials.fl_str_mv |
SENAI CIMATEC |
dc.publisher.country.fl_str_mv |
brasil |
publisher.none.fl_str_mv |
Faculdade de Tecnologia SENAI CIMATEC Faculdade de Tecnologia SENAI CIMATEC |
dc.source.none.fl_str_mv |
reponame:Repositório da Produção Científica e Intelectual do SENAI CIMATEC instname:Serviço Nacional de Aprendizagem Industrial Campus Integrado de Manufatura e Tecnologia (SENAI CIMATEC) instacron:SENAI CIMATEC |
instname_str |
Serviço Nacional de Aprendizagem Industrial Campus Integrado de Manufatura e Tecnologia (SENAI CIMATEC) |
instacron_str |
SENAI CIMATEC |
institution |
SENAI CIMATEC |
reponame_str |
Repositório da Produção Científica e Intelectual do SENAI CIMATEC |
collection |
Repositório da Produção Científica e Intelectual do SENAI CIMATEC |
bitstream.url.fl_str_mv |
http://repositoriosenaiba.fieb.org.br/bitstream/fieb/749/1/Dissertacao%20Oberdan%20Rocha%20Pinheiro.pdf http://repositoriosenaiba.fieb.org.br/bitstream/fieb/749/2/license.txt |
bitstream.checksum.fl_str_mv |
07e085bffa3fd1d6d2e4db657f9061b1 8a4605be74aa9ea9d79846c1fba20a33 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositório da Produção Científica e Intelectual do SENAI CIMATEC - Serviço Nacional de Aprendizagem Industrial Campus Integrado de Manufatura e Tecnologia (SENAI CIMATEC) |
repository.mail.fl_str_mv |
|
_version_ |
1813184713685204992 |