Dynamic thermal management for noc-based many-core systems

Detalhes bibliográficos
Autor(a) principal: Silva, Alzemiro Henrique Lucas da
Data de Publicação: 2021
Tipo de documento: Tese
Idioma: eng
Título da fonte: Biblioteca Digital de Teses e Dissertações da PUC_RS
Texto Completo: http://tede2.pucrs.br/tede2/handle/tede/9831
Resumo: Nodos tecnológicos recentes permitem fabricar bilhões de transistores em uma pequena área de silício, replicando estruturas idênticas, resultando em sistemas manycore. No entanto, a densidade de potência pode limitar a quantidade de potência que o sistema pode consumir. Um many-core em seu desempenho máximo pode levar a violar temperatura segura e, consequentemente, resultar em problemas de confiabilidade. Técnicas de gerenciamento térmico dinâmico (DTM) foram propostas para garantir que sistemas many-core funcionem com bom desempenho sem comprometer a confiabilidade. Técnicas DTM dependem de dados precisos de monitoramento de temperatura. Esta Tese revisa trabalhos recentes de DTM e propõe um novo método para permitir o monitoramento da temperatura em tempo de execução em um sistema many-core, novas heurísticas tendo por função custo a temperatura, bem como métodos de atuação, mapeamento e migração de tarefas e controle dinâmico de frequência e tensão (DVFS). Os trabalhos do estado-daarte sobre técnicas de DTM apresentam heurísticas complexas de atuação em tempo de execução, com foco principalmente no mapeamento de tarefas, e não se apresentam métodos de monitoramento de temperatura, comprometendo a aplicabilidade em sistemas reais. O estado da arte também apresenta trabalhos voltados ao gerenciamento dinâmico de confiabilidade (DRM), onde o objetivo principal é garantir maior confiabilidade ao sistema, utilizando as mesmas técnicas de atuação para controlar a temperatura. Esta Tese também revisa alguns dos efeitos de envelhecimento em circuitos integrados e analisa resultados de confiabilidade relacionados ao tempo de vida para as heurísticas propostas. As principais contribuições desta Tese incluem: (i) um acelerador de hardware para estimativa térmica (TEA), (ii) uma heurística de gerenciamento de temperatura proporcional, integral e derivativa (PIDTM); (iii) uma heurística de gerenciamento de temperatura tendo por função custo restrições de energia (TMEC). TEA possibilitou o monitoramento preciso da temperatura em tempo de execução no many-core de referência, permitindo a validação das propostas de DTM. O PIDTM reduziu em até 7,15% a temperatura de pico em um cenário de alta carga de trabalho, enquanto o TMEC melhorou em até 82,9% a vida útil esperada do sistema.
id P_RS_b71918409b7ce3b5dc9a5bb4a55e411b
oai_identifier_str oai:tede2.pucrs.br:tede/9831
network_acronym_str P_RS
network_name_str Biblioteca Digital de Teses e Dissertações da PUC_RS
repository_id_str
spelling Moraes, Fernando Gehmhttp://lattes.cnpq.br/2509301929350826Martins, André Luís del Mestrehttp://lattes.cnpq.br/8570090119222585http://lattes.cnpq.br/7440082672087018Silva, Alzemiro Henrique Lucas da2021-09-01T12:39:55Z2021-08-12http://tede2.pucrs.br/tede2/handle/tede/9831Nodos tecnológicos recentes permitem fabricar bilhões de transistores em uma pequena área de silício, replicando estruturas idênticas, resultando em sistemas manycore. No entanto, a densidade de potência pode limitar a quantidade de potência que o sistema pode consumir. Um many-core em seu desempenho máximo pode levar a violar temperatura segura e, consequentemente, resultar em problemas de confiabilidade. Técnicas de gerenciamento térmico dinâmico (DTM) foram propostas para garantir que sistemas many-core funcionem com bom desempenho sem comprometer a confiabilidade. Técnicas DTM dependem de dados precisos de monitoramento de temperatura. Esta Tese revisa trabalhos recentes de DTM e propõe um novo método para permitir o monitoramento da temperatura em tempo de execução em um sistema many-core, novas heurísticas tendo por função custo a temperatura, bem como métodos de atuação, mapeamento e migração de tarefas e controle dinâmico de frequência e tensão (DVFS). Os trabalhos do estado-daarte sobre técnicas de DTM apresentam heurísticas complexas de atuação em tempo de execução, com foco principalmente no mapeamento de tarefas, e não se apresentam métodos de monitoramento de temperatura, comprometendo a aplicabilidade em sistemas reais. O estado da arte também apresenta trabalhos voltados ao gerenciamento dinâmico de confiabilidade (DRM), onde o objetivo principal é garantir maior confiabilidade ao sistema, utilizando as mesmas técnicas de atuação para controlar a temperatura. Esta Tese também revisa alguns dos efeitos de envelhecimento em circuitos integrados e analisa resultados de confiabilidade relacionados ao tempo de vida para as heurísticas propostas. As principais contribuições desta Tese incluem: (i) um acelerador de hardware para estimativa térmica (TEA), (ii) uma heurística de gerenciamento de temperatura proporcional, integral e derivativa (PIDTM); (iii) uma heurística de gerenciamento de temperatura tendo por função custo restrições de energia (TMEC). TEA possibilitou o monitoramento preciso da temperatura em tempo de execução no many-core de referência, permitindo a validação das propostas de DTM. O PIDTM reduziu em até 7,15% a temperatura de pico em um cenário de alta carga de trabalho, enquanto o TMEC melhorou em até 82,9% a vida útil esperada do sistema.Recent technology nodes enable to deploy billions of transistors in a small silicon area by replicating identical structures, resulting in many-core systems. However, power density may limit the amount of power the system can consume. A many-core at its maximum performance may lead to violate safe temperature definition and, consequently, result in reliability issues. Dynamic Thermal Management (DTM) techniques have been proposed to guarantee that many-core systems run at good performance without compromising reliability. DTM techniques rely on accurate temperature monitoring data. This Thesis reviews recent DTM works and proposes a new method to enable runtime temperature monitoring in a many-core system and new heuristics for thermal-aware application mapping, migration, and dynamic frequency and voltage scaling (DVFS) actuation, considering temperature and energy consumption. The state-of-art study on DTM techniques presents complex mechanisms for runtime actuation, focusing mainly on task mapping, and shows no concern about temperature monitoring methods, compromising the applicability in real systems. The stateof-art also presents works targeting dynamic reliability management (DRM), where the main objective is to ensure longer lifetime for the system, using the same actuation knobs used to control the temperature. This thesis also reviews some of the aging effects and analyses the lifetime reliability results for the proposed heuristics. The main contributions of this Thesis include: (i) a thermal estimation accelerator (TEA), (ii) a proportional, integral and derivative temperature management (PIDTM) heuristic; (iii) a temperature management heuristic having as cost function energy constraints (TMEC). TEA enabled accurate runtime temperature monitoring in the reference many-core, enabling the validation of the DTM proposals. PIDTM reduced up to 7.15% the overall peak temperature in a high workload scenario, while TMEC improved up to 82.9% in the system’s expected lifetime.Submitted by PPG Ciência da Computação (ppgcc@pucrs.br) on 2021-08-31T20:02:36Z No. of bitstreams: 1 ALZEMIRO HENRIQUE LUCAS DA SILVA_TES.pdf: 7365980 bytes, checksum: cddc3c92cc8350eb514a212342cb6d6d (MD5)Approved for entry into archive by Sheila Dias (sheila.dias@pucrs.br) on 2021-09-01T12:30:58Z (GMT) No. of bitstreams: 1 ALZEMIRO HENRIQUE LUCAS DA SILVA_TES.pdf: 7365980 bytes, checksum: cddc3c92cc8350eb514a212342cb6d6d (MD5)Made available in DSpace on 2021-09-01T12:39:55Z (GMT). No. of bitstreams: 1 ALZEMIRO HENRIQUE LUCAS DA SILVA_TES.pdf: 7365980 bytes, checksum: cddc3c92cc8350eb514a212342cb6d6d (MD5) Previous issue date: 2021-08-12Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPESapplication/pdfhttp://tede2.pucrs.br:80/tede2/retrieve/181865/ALZEMIRO%20HENRIQUE%20LUCAS%20DA%20SILVA_TES.pdf.jpgengPontifícia Universidade Católica do Rio Grande do SulPrograma de Pós-Graduação em Ciência da ComputaçãoPUCRSBrasilEscola PolitécnicaMany-core SystemsTemperature MonitoringDynamic Thermal ManagementLifetime ReliabilityMappingSistemas Many-coreMonitoramento de TemperaturaGerenciamento Dinâmico da TemperaturaConfiabilidade de Tempo de VidaMapeamentoCIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAODynamic thermal management for noc-based many-core systemsGerenciamento térmico dinâmico em sistemas many-core baseados em redes intra chipinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisTrabalho não apresenta restrição para publicação-4570527706994352458500500600-8620782570833253013590462550136975366info:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da PUC_RSinstname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)instacron:PUC_RSTHUMBNAILALZEMIRO HENRIQUE LUCAS DA SILVA_TES.pdf.jpgALZEMIRO HENRIQUE LUCAS DA SILVA_TES.pdf.jpgimage/jpeg5394http://tede2.pucrs.br/tede2/bitstream/tede/9831/4/ALZEMIRO+HENRIQUE+LUCAS+DA+SILVA_TES.pdf.jpg947bccdcc79434008ca7c754b51964c8MD54TEXTALZEMIRO HENRIQUE LUCAS DA SILVA_TES.pdf.txtALZEMIRO HENRIQUE LUCAS DA SILVA_TES.pdf.txttext/plain249776http://tede2.pucrs.br/tede2/bitstream/tede/9831/3/ALZEMIRO+HENRIQUE+LUCAS+DA+SILVA_TES.pdf.txt8afc50ca7c48fd7c2ed0e952165ea0c0MD53ORIGINALALZEMIRO HENRIQUE LUCAS DA SILVA_TES.pdfALZEMIRO HENRIQUE LUCAS DA SILVA_TES.pdfapplication/pdf7365980http://tede2.pucrs.br/tede2/bitstream/tede/9831/2/ALZEMIRO+HENRIQUE+LUCAS+DA+SILVA_TES.pdfcddc3c92cc8350eb514a212342cb6d6dMD52LICENSElicense.txtlicense.txttext/plain; charset=utf-8590http://tede2.pucrs.br/tede2/bitstream/tede/9831/1/license.txt220e11f2d3ba5354f917c7035aadef24MD51tede/98312021-09-01 12:00:25.336oai:tede2.pucrs.br:tede/9831QXV0b3JpemE/P28gcGFyYSBQdWJsaWNhPz9vIEVsZXRyP25pY2E6IENvbSBiYXNlIG5vIGRpc3Bvc3RvIG5hIExlaSBGZWRlcmFsIG4/OS42MTAsIGRlIDE5IGRlIGZldmVyZWlybyBkZSAxOTk4LCBvIGF1dG9yIEFVVE9SSVpBIGEgcHVibGljYT8/byBlbGV0cj9uaWNhIGRhIHByZXNlbnRlIG9icmEgbm8gYWNlcnZvIGRhIEJpYmxpb3RlY2EgRGlnaXRhbCBkYSBQb250aWY/Y2lhIFVuaXZlcnNpZGFkZSBDYXQ/bGljYSBkbyBSaW8gR3JhbmRlIGRvIFN1bCwgc2VkaWFkYSBhIEF2LiBJcGlyYW5nYSA2NjgxLCBQb3J0byBBbGVncmUsIFJpbyBHcmFuZGUgZG8gU3VsLCBjb20gcmVnaXN0cm8gZGUgQ05QSiA4ODYzMDQxMzAwMDItODEgYmVtIGNvbW8gZW0gb3V0cmFzIGJpYmxpb3RlY2FzIGRpZ2l0YWlzLCBuYWNpb25haXMgZSBpbnRlcm5hY2lvbmFpcywgY29ucz9yY2lvcyBlIHJlZGVzID9zIHF1YWlzIGEgYmlibGlvdGVjYSBkYSBQVUNSUyBwb3NzYSBhIHZpciBwYXJ0aWNpcGFyLCBzZW0gP251cyBhbHVzaXZvIGFvcyBkaXJlaXRvcyBhdXRvcmFpcywgYSB0P3R1bG8gZGUgZGl2dWxnYT8/byBkYSBwcm9kdT8/byBjaWVudD9maWNhLgo=Biblioteca Digital de Teses e Dissertaçõeshttp://tede2.pucrs.br/tede2/PRIhttps://tede2.pucrs.br/oai/requestbiblioteca.central@pucrs.br||opendoar:2021-09-01T15:00:25Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)false
dc.title.por.fl_str_mv Dynamic thermal management for noc-based many-core systems
dc.title.alternative.por.fl_str_mv Gerenciamento térmico dinâmico em sistemas many-core baseados em redes intra chip
title Dynamic thermal management for noc-based many-core systems
spellingShingle Dynamic thermal management for noc-based many-core systems
Silva, Alzemiro Henrique Lucas da
Many-core Systems
Temperature Monitoring
Dynamic Thermal Management
Lifetime Reliability
Mapping
Sistemas Many-core
Monitoramento de Temperatura
Gerenciamento Dinâmico da Temperatura
Confiabilidade de Tempo de Vida
Mapeamento
CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO
title_short Dynamic thermal management for noc-based many-core systems
title_full Dynamic thermal management for noc-based many-core systems
title_fullStr Dynamic thermal management for noc-based many-core systems
title_full_unstemmed Dynamic thermal management for noc-based many-core systems
title_sort Dynamic thermal management for noc-based many-core systems
author Silva, Alzemiro Henrique Lucas da
author_facet Silva, Alzemiro Henrique Lucas da
author_role author
dc.contributor.advisor1.fl_str_mv Moraes, Fernando Gehm
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/2509301929350826
dc.contributor.advisor-co1.fl_str_mv Martins, André Luís del Mestre
dc.contributor.advisor-co1Lattes.fl_str_mv http://lattes.cnpq.br/8570090119222585
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/7440082672087018
dc.contributor.author.fl_str_mv Silva, Alzemiro Henrique Lucas da
contributor_str_mv Moraes, Fernando Gehm
Martins, André Luís del Mestre
dc.subject.eng.fl_str_mv Many-core Systems
Temperature Monitoring
Dynamic Thermal Management
Lifetime Reliability
Mapping
topic Many-core Systems
Temperature Monitoring
Dynamic Thermal Management
Lifetime Reliability
Mapping
Sistemas Many-core
Monitoramento de Temperatura
Gerenciamento Dinâmico da Temperatura
Confiabilidade de Tempo de Vida
Mapeamento
CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO
dc.subject.por.fl_str_mv Sistemas Many-core
Monitoramento de Temperatura
Gerenciamento Dinâmico da Temperatura
Confiabilidade de Tempo de Vida
Mapeamento
dc.subject.cnpq.fl_str_mv CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO
description Nodos tecnológicos recentes permitem fabricar bilhões de transistores em uma pequena área de silício, replicando estruturas idênticas, resultando em sistemas manycore. No entanto, a densidade de potência pode limitar a quantidade de potência que o sistema pode consumir. Um many-core em seu desempenho máximo pode levar a violar temperatura segura e, consequentemente, resultar em problemas de confiabilidade. Técnicas de gerenciamento térmico dinâmico (DTM) foram propostas para garantir que sistemas many-core funcionem com bom desempenho sem comprometer a confiabilidade. Técnicas DTM dependem de dados precisos de monitoramento de temperatura. Esta Tese revisa trabalhos recentes de DTM e propõe um novo método para permitir o monitoramento da temperatura em tempo de execução em um sistema many-core, novas heurísticas tendo por função custo a temperatura, bem como métodos de atuação, mapeamento e migração de tarefas e controle dinâmico de frequência e tensão (DVFS). Os trabalhos do estado-daarte sobre técnicas de DTM apresentam heurísticas complexas de atuação em tempo de execução, com foco principalmente no mapeamento de tarefas, e não se apresentam métodos de monitoramento de temperatura, comprometendo a aplicabilidade em sistemas reais. O estado da arte também apresenta trabalhos voltados ao gerenciamento dinâmico de confiabilidade (DRM), onde o objetivo principal é garantir maior confiabilidade ao sistema, utilizando as mesmas técnicas de atuação para controlar a temperatura. Esta Tese também revisa alguns dos efeitos de envelhecimento em circuitos integrados e analisa resultados de confiabilidade relacionados ao tempo de vida para as heurísticas propostas. As principais contribuições desta Tese incluem: (i) um acelerador de hardware para estimativa térmica (TEA), (ii) uma heurística de gerenciamento de temperatura proporcional, integral e derivativa (PIDTM); (iii) uma heurística de gerenciamento de temperatura tendo por função custo restrições de energia (TMEC). TEA possibilitou o monitoramento preciso da temperatura em tempo de execução no many-core de referência, permitindo a validação das propostas de DTM. O PIDTM reduziu em até 7,15% a temperatura de pico em um cenário de alta carga de trabalho, enquanto o TMEC melhorou em até 82,9% a vida útil esperada do sistema.
publishDate 2021
dc.date.accessioned.fl_str_mv 2021-09-01T12:39:55Z
dc.date.issued.fl_str_mv 2021-08-12
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://tede2.pucrs.br/tede2/handle/tede/9831
url http://tede2.pucrs.br/tede2/handle/tede/9831
dc.language.iso.fl_str_mv eng
language eng
dc.relation.program.fl_str_mv -4570527706994352458
dc.relation.confidence.fl_str_mv 500
500
600
dc.relation.cnpq.fl_str_mv -862078257083325301
dc.relation.sponsorship.fl_str_mv 3590462550136975366
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Pontifícia Universidade Católica do Rio Grande do Sul
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Ciência da Computação
dc.publisher.initials.fl_str_mv PUCRS
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Escola Politécnica
publisher.none.fl_str_mv Pontifícia Universidade Católica do Rio Grande do Sul
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da PUC_RS
instname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
instacron:PUC_RS
instname_str Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
instacron_str PUC_RS
institution PUC_RS
reponame_str Biblioteca Digital de Teses e Dissertações da PUC_RS
collection Biblioteca Digital de Teses e Dissertações da PUC_RS
bitstream.url.fl_str_mv http://tede2.pucrs.br/tede2/bitstream/tede/9831/4/ALZEMIRO+HENRIQUE+LUCAS+DA+SILVA_TES.pdf.jpg
http://tede2.pucrs.br/tede2/bitstream/tede/9831/3/ALZEMIRO+HENRIQUE+LUCAS+DA+SILVA_TES.pdf.txt
http://tede2.pucrs.br/tede2/bitstream/tede/9831/2/ALZEMIRO+HENRIQUE+LUCAS+DA+SILVA_TES.pdf
http://tede2.pucrs.br/tede2/bitstream/tede/9831/1/license.txt
bitstream.checksum.fl_str_mv 947bccdcc79434008ca7c754b51964c8
8afc50ca7c48fd7c2ed0e952165ea0c0
cddc3c92cc8350eb514a212342cb6d6d
220e11f2d3ba5354f917c7035aadef24
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
repository.mail.fl_str_mv biblioteca.central@pucrs.br||
_version_ 1799765351631683584