Implementação de um cluster para aplicações de HPC utilizando docker e infiniband

Detalhes bibliográficos
Autor(a) principal: Silva, Weslley da Costa
Data de Publicação: 2023
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UFSC
Texto Completo: https://repositorio.ufsc.br/handle/123456789/248704
Resumo: TCC (graduação) - Universidade Federal de Santa Catarina, Centro Tecnológico, Ciências da Computação.
id UFSC_d98178c552cc58bee829323c1445de03
oai_identifier_str oai:repositorio.ufsc.br:123456789/248704
network_acronym_str UFSC
network_name_str Repositório Institucional da UFSC
repository_id_str 2373
spelling Implementação de um cluster para aplicações de HPC utilizando docker e infinibandDockerInfinibandHPCSLURMSwarmTCC (graduação) - Universidade Federal de Santa Catarina, Centro Tecnológico, Ciências da Computação.Diante dos desafios da Computação de Alto Desempenho, surgem questões agravantes ao tentar provê-la na forma de autosserviço, como (i) a diversidade de softwares a serem suportados; (ii) a constante necessidade de atualização (bibliotecas, softwares, sistema operacional, etc.) e (iii) a execução em hardwares heterogêneos. Sanar estes pontos utilizando apenas os métodos tradicionais de gerenciamento de clusters ou de configuração, se demonstrou inviável dada a flexibilidade exigida pelo cenário. Assim, o objetivo deste projeto é o de desenvolver uma solução que (i) simplifique a manutenção dos clusters, (ii) possibilite ao usuário controlar o ambiente de execução do software e (iii) suporte uma diversidade de softwares evitando conflitos. Este trabalho aborda o contexto, requisitos, modelagem e a implementação do serviço na Superintendência de Governança Eletrônica e Tecnologia da Informação e Comunicação (SeTIC), criando um ambiente constituindo por 7 clusters que, juntos, somam mais de 40 nós, 7TB de RAM, 1.200 núcleos e 40.000 núcleos de processamento gráfico.In the face of High Performance Computing challenges, there are aggravating issues when attempting to provide it in a self-service manner, such as (i) the diversity of software to be supported, (ii) the constant need for updates (libraries, software, operating system, etc.), and (iii) execution on heterogeneous hardware. Addressing these points using tra- ditional cluster management or configuration methods proved to be unfeasible given the flexibility required by the scenario. Therefore, the objective of this project is to develop a solution that (i) simplifies cluster maintenance, (ii) enables users to control the software execution environment, and (iii) supports a diversity of software, avoiding conflicts. This work addresses the context, requirements, modeling, and implementation of the service at SETIC, creating an environment consisting of 7 clusters that, together, total over 40 nodes, 7TB of RAM, 1,200 cores, and 40,000 graphics processing cores.Florianópolis, SC.Gerônimo, Guilherme ArthurMendizabal, Odorico MachadoUniversidade Federal de Santa Catarina.Silva, Weslley da Costa2023-07-12T14:03:16Z2023-07-12T14:03:16Z2023-07-03info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesis53 f.application/pdfhttps://repositorio.ufsc.br/handle/123456789/248704Open Access.info:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFSCinstname:Universidade Federal de Santa Catarina (UFSC)instacron:UFSC2023-07-12T14:03:16Zoai:repositorio.ufsc.br:123456789/248704Repositório InstitucionalPUBhttp://150.162.242.35/oai/requestopendoar:23732023-07-12T14:03:16Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)false
dc.title.none.fl_str_mv Implementação de um cluster para aplicações de HPC utilizando docker e infiniband
title Implementação de um cluster para aplicações de HPC utilizando docker e infiniband
spellingShingle Implementação de um cluster para aplicações de HPC utilizando docker e infiniband
Silva, Weslley da Costa
Docker
Infiniband
HPC
SLURM
Swarm
title_short Implementação de um cluster para aplicações de HPC utilizando docker e infiniband
title_full Implementação de um cluster para aplicações de HPC utilizando docker e infiniband
title_fullStr Implementação de um cluster para aplicações de HPC utilizando docker e infiniband
title_full_unstemmed Implementação de um cluster para aplicações de HPC utilizando docker e infiniband
title_sort Implementação de um cluster para aplicações de HPC utilizando docker e infiniband
author Silva, Weslley da Costa
author_facet Silva, Weslley da Costa
author_role author
dc.contributor.none.fl_str_mv Gerônimo, Guilherme Arthur
Mendizabal, Odorico Machado
Universidade Federal de Santa Catarina.
dc.contributor.author.fl_str_mv Silva, Weslley da Costa
dc.subject.por.fl_str_mv Docker
Infiniband
HPC
SLURM
Swarm
topic Docker
Infiniband
HPC
SLURM
Swarm
description TCC (graduação) - Universidade Federal de Santa Catarina, Centro Tecnológico, Ciências da Computação.
publishDate 2023
dc.date.none.fl_str_mv 2023-07-12T14:03:16Z
2023-07-12T14:03:16Z
2023-07-03
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.ufsc.br/handle/123456789/248704
url https://repositorio.ufsc.br/handle/123456789/248704
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Open Access.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Open Access.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 53 f.
application/pdf
dc.publisher.none.fl_str_mv Florianópolis, SC.
publisher.none.fl_str_mv Florianópolis, SC.
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSC
instname:Universidade Federal de Santa Catarina (UFSC)
instacron:UFSC
instname_str Universidade Federal de Santa Catarina (UFSC)
instacron_str UFSC
institution UFSC
reponame_str Repositório Institucional da UFSC
collection Repositório Institucional da UFSC
repository.name.fl_str_mv Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)
repository.mail.fl_str_mv
_version_ 1808652259603513344