Escalonamento de aplicações que processam grandes quantidades de dados em grids computacionais.

Detalhes bibliográficos
Autor(a) principal: SANTOS NETO, Elizeu Lourenço dos.
Data de Publicação: 2004
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da UFCG
Texto Completo: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/2639
Resumo: Aplicações que processam grandes quantidades de dados demandam grandes transferências de dados quando executadas em grids computacionais. Estas transferências têm um alto custo associado. Portanto, considerar as transferências de dados é fundamental para se obter escalonamentos eficientes para tais aplicações. Além disso, em ambientes heterogêneos como os grids, as heurísticas que produzem escalonamentos eficientes tipicamente usam informação dinâmica sobre o grid e as aplicações (disponibilidade de rede e CPU, tempo de execução das tarefas, etc). Porém, estas informações são, em geral, difíceis de se obter com precisão. Embora existam escalonadores que alcançam bom desempenho sem usar informações dinâmicas, eles não são desenvolvidos para considerar o impacto das transferências de dados. Neste trabalho apresentamos Storage Affinity, uma nova heurística de escalonamento para aplicações do tipo Bag-of-Tasks que processam grandes quantidades de dados sem depender de informação de difícil obtenção. Além disso, o ambiente de execução considerado é um grid computacional. Storage Affinity explora os padrões de reutilização de dados, comuns em muitas aplicações, pois isto permite considerar as transferências de dados sem usar informações dinâmicas sobre os recursos, reduzindo o tempo total de execução da aplicação. Através do uso de uma estratégia de replicação de tarefas, Storage Affinity efetua escalonamentos eficientes sem depender de informação dinâmica. Os resultados mostram que Storage Affinity pode alcançar uma performance, em média, melhor do que os escalonadores estado-da-arte que dependem de informação, mesmo em situações onde tais escalonadores usam informação perfeita. Em contrapartida, há um acréscimo no consumo de ciclos de CPU (em média, ) para alcançar este desempenho devido a replicação de tarefas.
id UFCG_a58908790b65308d291f2cb942be2e91
oai_identifier_str oai:localhost:riufcg/2639
network_acronym_str UFCG
network_name_str Biblioteca Digital de Teses e Dissertações da UFCG
repository_id_str 4851
spelling Escalonamento de aplicações que processam grandes quantidades de dados em grids computacionais.Scaling of applications that process large amounts of data in computational grids.Scaling of applications that process large amounts of data in computational gridsSistemas distribuídos.Grids computacionais.Escalonamento.Bag of tasks.Distributed systems.Computational grids.Scheduling.Ciência da computação.Aplicações que processam grandes quantidades de dados demandam grandes transferências de dados quando executadas em grids computacionais. Estas transferências têm um alto custo associado. Portanto, considerar as transferências de dados é fundamental para se obter escalonamentos eficientes para tais aplicações. Além disso, em ambientes heterogêneos como os grids, as heurísticas que produzem escalonamentos eficientes tipicamente usam informação dinâmica sobre o grid e as aplicações (disponibilidade de rede e CPU, tempo de execução das tarefas, etc). Porém, estas informações são, em geral, difíceis de se obter com precisão. Embora existam escalonadores que alcançam bom desempenho sem usar informações dinâmicas, eles não são desenvolvidos para considerar o impacto das transferências de dados. Neste trabalho apresentamos Storage Affinity, uma nova heurística de escalonamento para aplicações do tipo Bag-of-Tasks que processam grandes quantidades de dados sem depender de informação de difícil obtenção. Além disso, o ambiente de execução considerado é um grid computacional. Storage Affinity explora os padrões de reutilização de dados, comuns em muitas aplicações, pois isto permite considerar as transferências de dados sem usar informações dinâmicas sobre os recursos, reduzindo o tempo total de execução da aplicação. Através do uso de uma estratégia de replicação de tarefas, Storage Affinity efetua escalonamentos eficientes sem depender de informação dinâmica. Os resultados mostram que Storage Affinity pode alcançar uma performance, em média, melhor do que os escalonadores estado-da-arte que dependem de informação, mesmo em situações onde tais escalonadores usam informação perfeita. Em contrapartida, há um acréscimo no consumo de ciclos de CPU (em média, ) para alcançar este desempenho devido a replicação de tarefas.Data-intensive applications executing over a computational grid demand large data transfers. These are costly operations. Therefore, taking them into account is mandatory to achieve efficient scheduling of data-intensive applications on grids. Further, within an heterogeneous environment such as a grid, good schedules are typically attained by heuristics that use dynamic information about the grid and the applications (network and CPU loads, completion time of tasks, etc). However, these information are often difficult to be obtained accurately. Although there are schedulers that attain good performance without requiring that kind of information, they were not designed to take data transfer delays into account. This work presents Storage Affinity, a novel scheduling heuristic for Bag-of-Tasks and data-intensive applications running on grid environments. Storage Affinity exploits a data reuse pattern, common on many data-intensive applications, allowing it to take data transfer delays into account and reduce the makespan of the application. Further, it uses a replication strategy that yields efficient schedules without relying upon dynamic information that is difficult to obtain. Our results show that Storage Affinity may attain performance that is in average better than that of state-of-the-art knowledge-dependent schedulers, even in the unlikely c a s e when the latter are fed with perfect information. This is achieved at the expense of consuming more CPU cycles (in average, more than not using replication).Universidade Federal de Campina GrandeBrasilCentro de Ciências e Tecnologia - CCTPÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃOUFCGCIRNE FILHO, Walfredo da Costa.CIRNE FILHO, W. C.http://lattes.cnpq.br/5908699791494075BRASILEIRO, Francisco Vilar.KOFUJI, Sergio Takeo.SANTOS NETO, Elizeu Lourenço dos.2004-02-182019-01-30T17:16:17Z2019-01-302019-01-30T17:16:17Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttp://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/2639NETO,Elizeu Florenço dos Santos. Escalonamento de aplicações que processam grandes quantidades de dados em grids computacionais. 2004. 84f. (Dissertação de Mestrado em Ciência da Computação) Programa de Pós-graduação em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande - Paraíba - Brasil, 2013. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/2639porinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFCGinstname:Universidade Federal de Campina Grande (UFCG)instacron:UFCG2022-03-22T13:05:46Zoai:localhost:riufcg/2639Biblioteca Digital de Teses e Dissertaçõeshttp://bdtd.ufcg.edu.br/PUBhttp://dspace.sti.ufcg.edu.br:8080/oai/requestbdtd@setor.ufcg.edu.br || bdtd@setor.ufcg.edu.bropendoar:48512022-03-22T13:05:46Biblioteca Digital de Teses e Dissertações da UFCG - Universidade Federal de Campina Grande (UFCG)false
dc.title.none.fl_str_mv Escalonamento de aplicações que processam grandes quantidades de dados em grids computacionais.
Scaling of applications that process large amounts of data in computational grids.
Scaling of applications that process large amounts of data in computational grids
title Escalonamento de aplicações que processam grandes quantidades de dados em grids computacionais.
spellingShingle Escalonamento de aplicações que processam grandes quantidades de dados em grids computacionais.
SANTOS NETO, Elizeu Lourenço dos.
Sistemas distribuídos.
Grids computacionais.
Escalonamento.
Bag of tasks.
Distributed systems.
Computational grids.
Scheduling.
Ciência da computação.
title_short Escalonamento de aplicações que processam grandes quantidades de dados em grids computacionais.
title_full Escalonamento de aplicações que processam grandes quantidades de dados em grids computacionais.
title_fullStr Escalonamento de aplicações que processam grandes quantidades de dados em grids computacionais.
title_full_unstemmed Escalonamento de aplicações que processam grandes quantidades de dados em grids computacionais.
title_sort Escalonamento de aplicações que processam grandes quantidades de dados em grids computacionais.
author SANTOS NETO, Elizeu Lourenço dos.
author_facet SANTOS NETO, Elizeu Lourenço dos.
author_role author
dc.contributor.none.fl_str_mv CIRNE FILHO, Walfredo da Costa.
CIRNE FILHO, W. C.
http://lattes.cnpq.br/5908699791494075
BRASILEIRO, Francisco Vilar.
KOFUJI, Sergio Takeo.
dc.contributor.author.fl_str_mv SANTOS NETO, Elizeu Lourenço dos.
dc.subject.por.fl_str_mv Sistemas distribuídos.
Grids computacionais.
Escalonamento.
Bag of tasks.
Distributed systems.
Computational grids.
Scheduling.
Ciência da computação.
topic Sistemas distribuídos.
Grids computacionais.
Escalonamento.
Bag of tasks.
Distributed systems.
Computational grids.
Scheduling.
Ciência da computação.
description Aplicações que processam grandes quantidades de dados demandam grandes transferências de dados quando executadas em grids computacionais. Estas transferências têm um alto custo associado. Portanto, considerar as transferências de dados é fundamental para se obter escalonamentos eficientes para tais aplicações. Além disso, em ambientes heterogêneos como os grids, as heurísticas que produzem escalonamentos eficientes tipicamente usam informação dinâmica sobre o grid e as aplicações (disponibilidade de rede e CPU, tempo de execução das tarefas, etc). Porém, estas informações são, em geral, difíceis de se obter com precisão. Embora existam escalonadores que alcançam bom desempenho sem usar informações dinâmicas, eles não são desenvolvidos para considerar o impacto das transferências de dados. Neste trabalho apresentamos Storage Affinity, uma nova heurística de escalonamento para aplicações do tipo Bag-of-Tasks que processam grandes quantidades de dados sem depender de informação de difícil obtenção. Além disso, o ambiente de execução considerado é um grid computacional. Storage Affinity explora os padrões de reutilização de dados, comuns em muitas aplicações, pois isto permite considerar as transferências de dados sem usar informações dinâmicas sobre os recursos, reduzindo o tempo total de execução da aplicação. Através do uso de uma estratégia de replicação de tarefas, Storage Affinity efetua escalonamentos eficientes sem depender de informação dinâmica. Os resultados mostram que Storage Affinity pode alcançar uma performance, em média, melhor do que os escalonadores estado-da-arte que dependem de informação, mesmo em situações onde tais escalonadores usam informação perfeita. Em contrapartida, há um acréscimo no consumo de ciclos de CPU (em média, ) para alcançar este desempenho devido a replicação de tarefas.
publishDate 2004
dc.date.none.fl_str_mv 2004-02-18
2019-01-30T17:16:17Z
2019-01-30
2019-01-30T17:16:17Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/2639
NETO,Elizeu Florenço dos Santos. Escalonamento de aplicações que processam grandes quantidades de dados em grids computacionais. 2004. 84f. (Dissertação de Mestrado em Ciência da Computação) Programa de Pós-graduação em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande - Paraíba - Brasil, 2013. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/2639
url http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/2639
identifier_str_mv NETO,Elizeu Florenço dos Santos. Escalonamento de aplicações que processam grandes quantidades de dados em grids computacionais. 2004. 84f. (Dissertação de Mestrado em Ciência da Computação) Programa de Pós-graduação em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande - Paraíba - Brasil, 2013. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/2639
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Campina Grande
Brasil
Centro de Ciências e Tecnologia - CCT
PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO
UFCG
publisher.none.fl_str_mv Universidade Federal de Campina Grande
Brasil
Centro de Ciências e Tecnologia - CCT
PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO
UFCG
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFCG
instname:Universidade Federal de Campina Grande (UFCG)
instacron:UFCG
instname_str Universidade Federal de Campina Grande (UFCG)
instacron_str UFCG
institution UFCG
reponame_str Biblioteca Digital de Teses e Dissertações da UFCG
collection Biblioteca Digital de Teses e Dissertações da UFCG
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFCG - Universidade Federal de Campina Grande (UFCG)
repository.mail.fl_str_mv bdtd@setor.ufcg.edu.br || bdtd@setor.ufcg.edu.br
_version_ 1809744365270073344