Escalonamento de aplicações que processam grandes quantidades de dados em grids computacionais.
Autor(a) principal: | |
---|---|
Data de Publicação: | 2004 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da UFCG |
Texto Completo: | http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/2639 |
Resumo: | Aplicações que processam grandes quantidades de dados demandam grandes transferências de dados quando executadas em grids computacionais. Estas transferências têm um alto custo associado. Portanto, considerar as transferências de dados é fundamental para se obter escalonamentos eficientes para tais aplicações. Além disso, em ambientes heterogêneos como os grids, as heurísticas que produzem escalonamentos eficientes tipicamente usam informação dinâmica sobre o grid e as aplicações (disponibilidade de rede e CPU, tempo de execução das tarefas, etc). Porém, estas informações são, em geral, difíceis de se obter com precisão. Embora existam escalonadores que alcançam bom desempenho sem usar informações dinâmicas, eles não são desenvolvidos para considerar o impacto das transferências de dados. Neste trabalho apresentamos Storage Affinity, uma nova heurística de escalonamento para aplicações do tipo Bag-of-Tasks que processam grandes quantidades de dados sem depender de informação de difícil obtenção. Além disso, o ambiente de execução considerado é um grid computacional. Storage Affinity explora os padrões de reutilização de dados, comuns em muitas aplicações, pois isto permite considerar as transferências de dados sem usar informações dinâmicas sobre os recursos, reduzindo o tempo total de execução da aplicação. Através do uso de uma estratégia de replicação de tarefas, Storage Affinity efetua escalonamentos eficientes sem depender de informação dinâmica. Os resultados mostram que Storage Affinity pode alcançar uma performance, em média, melhor do que os escalonadores estado-da-arte que dependem de informação, mesmo em situações onde tais escalonadores usam informação perfeita. Em contrapartida, há um acréscimo no consumo de ciclos de CPU (em média, ) para alcançar este desempenho devido a replicação de tarefas. |
id |
UFCG_a58908790b65308d291f2cb942be2e91 |
---|---|
oai_identifier_str |
oai:localhost:riufcg/2639 |
network_acronym_str |
UFCG |
network_name_str |
Biblioteca Digital de Teses e Dissertações da UFCG |
repository_id_str |
4851 |
spelling |
Escalonamento de aplicações que processam grandes quantidades de dados em grids computacionais.Scaling of applications that process large amounts of data in computational grids.Scaling of applications that process large amounts of data in computational gridsSistemas distribuídos.Grids computacionais.Escalonamento.Bag of tasks.Distributed systems.Computational grids.Scheduling.Ciência da computação.Aplicações que processam grandes quantidades de dados demandam grandes transferências de dados quando executadas em grids computacionais. Estas transferências têm um alto custo associado. Portanto, considerar as transferências de dados é fundamental para se obter escalonamentos eficientes para tais aplicações. Além disso, em ambientes heterogêneos como os grids, as heurísticas que produzem escalonamentos eficientes tipicamente usam informação dinâmica sobre o grid e as aplicações (disponibilidade de rede e CPU, tempo de execução das tarefas, etc). Porém, estas informações são, em geral, difíceis de se obter com precisão. Embora existam escalonadores que alcançam bom desempenho sem usar informações dinâmicas, eles não são desenvolvidos para considerar o impacto das transferências de dados. Neste trabalho apresentamos Storage Affinity, uma nova heurística de escalonamento para aplicações do tipo Bag-of-Tasks que processam grandes quantidades de dados sem depender de informação de difícil obtenção. Além disso, o ambiente de execução considerado é um grid computacional. Storage Affinity explora os padrões de reutilização de dados, comuns em muitas aplicações, pois isto permite considerar as transferências de dados sem usar informações dinâmicas sobre os recursos, reduzindo o tempo total de execução da aplicação. Através do uso de uma estratégia de replicação de tarefas, Storage Affinity efetua escalonamentos eficientes sem depender de informação dinâmica. Os resultados mostram que Storage Affinity pode alcançar uma performance, em média, melhor do que os escalonadores estado-da-arte que dependem de informação, mesmo em situações onde tais escalonadores usam informação perfeita. Em contrapartida, há um acréscimo no consumo de ciclos de CPU (em média, ) para alcançar este desempenho devido a replicação de tarefas.Data-intensive applications executing over a computational grid demand large data transfers. These are costly operations. Therefore, taking them into account is mandatory to achieve efficient scheduling of data-intensive applications on grids. Further, within an heterogeneous environment such as a grid, good schedules are typically attained by heuristics that use dynamic information about the grid and the applications (network and CPU loads, completion time of tasks, etc). However, these information are often difficult to be obtained accurately. Although there are schedulers that attain good performance without requiring that kind of information, they were not designed to take data transfer delays into account. This work presents Storage Affinity, a novel scheduling heuristic for Bag-of-Tasks and data-intensive applications running on grid environments. Storage Affinity exploits a data reuse pattern, common on many data-intensive applications, allowing it to take data transfer delays into account and reduce the makespan of the application. Further, it uses a replication strategy that yields efficient schedules without relying upon dynamic information that is difficult to obtain. Our results show that Storage Affinity may attain performance that is in average better than that of state-of-the-art knowledge-dependent schedulers, even in the unlikely c a s e when the latter are fed with perfect information. This is achieved at the expense of consuming more CPU cycles (in average, more than not using replication).Universidade Federal de Campina GrandeBrasilCentro de Ciências e Tecnologia - CCTPÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃOUFCGCIRNE FILHO, Walfredo da Costa.CIRNE FILHO, W. C.http://lattes.cnpq.br/5908699791494075BRASILEIRO, Francisco Vilar.KOFUJI, Sergio Takeo.SANTOS NETO, Elizeu Lourenço dos.2004-02-182019-01-30T17:16:17Z2019-01-302019-01-30T17:16:17Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttp://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/2639NETO,Elizeu Florenço dos Santos. Escalonamento de aplicações que processam grandes quantidades de dados em grids computacionais. 2004. 84f. (Dissertação de Mestrado em Ciência da Computação) Programa de Pós-graduação em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande - Paraíba - Brasil, 2013. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/2639porinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFCGinstname:Universidade Federal de Campina Grande (UFCG)instacron:UFCG2022-03-22T13:05:46Zoai:localhost:riufcg/2639Biblioteca Digital de Teses e Dissertaçõeshttp://bdtd.ufcg.edu.br/PUBhttp://dspace.sti.ufcg.edu.br:8080/oai/requestbdtd@setor.ufcg.edu.br || bdtd@setor.ufcg.edu.bropendoar:48512022-03-22T13:05:46Biblioteca Digital de Teses e Dissertações da UFCG - Universidade Federal de Campina Grande (UFCG)false |
dc.title.none.fl_str_mv |
Escalonamento de aplicações que processam grandes quantidades de dados em grids computacionais. Scaling of applications that process large amounts of data in computational grids. Scaling of applications that process large amounts of data in computational grids |
title |
Escalonamento de aplicações que processam grandes quantidades de dados em grids computacionais. |
spellingShingle |
Escalonamento de aplicações que processam grandes quantidades de dados em grids computacionais. SANTOS NETO, Elizeu Lourenço dos. Sistemas distribuídos. Grids computacionais. Escalonamento. Bag of tasks. Distributed systems. Computational grids. Scheduling. Ciência da computação. |
title_short |
Escalonamento de aplicações que processam grandes quantidades de dados em grids computacionais. |
title_full |
Escalonamento de aplicações que processam grandes quantidades de dados em grids computacionais. |
title_fullStr |
Escalonamento de aplicações que processam grandes quantidades de dados em grids computacionais. |
title_full_unstemmed |
Escalonamento de aplicações que processam grandes quantidades de dados em grids computacionais. |
title_sort |
Escalonamento de aplicações que processam grandes quantidades de dados em grids computacionais. |
author |
SANTOS NETO, Elizeu Lourenço dos. |
author_facet |
SANTOS NETO, Elizeu Lourenço dos. |
author_role |
author |
dc.contributor.none.fl_str_mv |
CIRNE FILHO, Walfredo da Costa. CIRNE FILHO, W. C. http://lattes.cnpq.br/5908699791494075 BRASILEIRO, Francisco Vilar. KOFUJI, Sergio Takeo. |
dc.contributor.author.fl_str_mv |
SANTOS NETO, Elizeu Lourenço dos. |
dc.subject.por.fl_str_mv |
Sistemas distribuídos. Grids computacionais. Escalonamento. Bag of tasks. Distributed systems. Computational grids. Scheduling. Ciência da computação. |
topic |
Sistemas distribuídos. Grids computacionais. Escalonamento. Bag of tasks. Distributed systems. Computational grids. Scheduling. Ciência da computação. |
description |
Aplicações que processam grandes quantidades de dados demandam grandes transferências de dados quando executadas em grids computacionais. Estas transferências têm um alto custo associado. Portanto, considerar as transferências de dados é fundamental para se obter escalonamentos eficientes para tais aplicações. Além disso, em ambientes heterogêneos como os grids, as heurísticas que produzem escalonamentos eficientes tipicamente usam informação dinâmica sobre o grid e as aplicações (disponibilidade de rede e CPU, tempo de execução das tarefas, etc). Porém, estas informações são, em geral, difíceis de se obter com precisão. Embora existam escalonadores que alcançam bom desempenho sem usar informações dinâmicas, eles não são desenvolvidos para considerar o impacto das transferências de dados. Neste trabalho apresentamos Storage Affinity, uma nova heurística de escalonamento para aplicações do tipo Bag-of-Tasks que processam grandes quantidades de dados sem depender de informação de difícil obtenção. Além disso, o ambiente de execução considerado é um grid computacional. Storage Affinity explora os padrões de reutilização de dados, comuns em muitas aplicações, pois isto permite considerar as transferências de dados sem usar informações dinâmicas sobre os recursos, reduzindo o tempo total de execução da aplicação. Através do uso de uma estratégia de replicação de tarefas, Storage Affinity efetua escalonamentos eficientes sem depender de informação dinâmica. Os resultados mostram que Storage Affinity pode alcançar uma performance, em média, melhor do que os escalonadores estado-da-arte que dependem de informação, mesmo em situações onde tais escalonadores usam informação perfeita. Em contrapartida, há um acréscimo no consumo de ciclos de CPU (em média, ) para alcançar este desempenho devido a replicação de tarefas. |
publishDate |
2004 |
dc.date.none.fl_str_mv |
2004-02-18 2019-01-30T17:16:17Z 2019-01-30 2019-01-30T17:16:17Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/2639 NETO,Elizeu Florenço dos Santos. Escalonamento de aplicações que processam grandes quantidades de dados em grids computacionais. 2004. 84f. (Dissertação de Mestrado em Ciência da Computação) Programa de Pós-graduação em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande - Paraíba - Brasil, 2013. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/2639 |
url |
http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/2639 |
identifier_str_mv |
NETO,Elizeu Florenço dos Santos. Escalonamento de aplicações que processam grandes quantidades de dados em grids computacionais. 2004. 84f. (Dissertação de Mestrado em Ciência da Computação) Programa de Pós-graduação em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande - Paraíba - Brasil, 2013. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/2639 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Campina Grande Brasil Centro de Ciências e Tecnologia - CCT PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO UFCG |
publisher.none.fl_str_mv |
Universidade Federal de Campina Grande Brasil Centro de Ciências e Tecnologia - CCT PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO UFCG |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UFCG instname:Universidade Federal de Campina Grande (UFCG) instacron:UFCG |
instname_str |
Universidade Federal de Campina Grande (UFCG) |
instacron_str |
UFCG |
institution |
UFCG |
reponame_str |
Biblioteca Digital de Teses e Dissertações da UFCG |
collection |
Biblioteca Digital de Teses e Dissertações da UFCG |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UFCG - Universidade Federal de Campina Grande (UFCG) |
repository.mail.fl_str_mv |
bdtd@setor.ufcg.edu.br || bdtd@setor.ufcg.edu.br |
_version_ |
1809744365270073344 |