Dynamic thermal management for noc-based many-core systems
Autor(a) principal: | |
---|---|
Data de Publicação: | 2021 |
Tipo de documento: | Tese |
Idioma: | eng |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da PUC_RS |
Texto Completo: | http://tede2.pucrs.br/tede2/handle/tede/9831 |
Resumo: | Nodos tecnológicos recentes permitem fabricar bilhões de transistores em uma pequena área de silício, replicando estruturas idênticas, resultando em sistemas manycore. No entanto, a densidade de potência pode limitar a quantidade de potência que o sistema pode consumir. Um many-core em seu desempenho máximo pode levar a violar temperatura segura e, consequentemente, resultar em problemas de confiabilidade. Técnicas de gerenciamento térmico dinâmico (DTM) foram propostas para garantir que sistemas many-core funcionem com bom desempenho sem comprometer a confiabilidade. Técnicas DTM dependem de dados precisos de monitoramento de temperatura. Esta Tese revisa trabalhos recentes de DTM e propõe um novo método para permitir o monitoramento da temperatura em tempo de execução em um sistema many-core, novas heurísticas tendo por função custo a temperatura, bem como métodos de atuação, mapeamento e migração de tarefas e controle dinâmico de frequência e tensão (DVFS). Os trabalhos do estado-daarte sobre técnicas de DTM apresentam heurísticas complexas de atuação em tempo de execução, com foco principalmente no mapeamento de tarefas, e não se apresentam métodos de monitoramento de temperatura, comprometendo a aplicabilidade em sistemas reais. O estado da arte também apresenta trabalhos voltados ao gerenciamento dinâmico de confiabilidade (DRM), onde o objetivo principal é garantir maior confiabilidade ao sistema, utilizando as mesmas técnicas de atuação para controlar a temperatura. Esta Tese também revisa alguns dos efeitos de envelhecimento em circuitos integrados e analisa resultados de confiabilidade relacionados ao tempo de vida para as heurísticas propostas. As principais contribuições desta Tese incluem: (i) um acelerador de hardware para estimativa térmica (TEA), (ii) uma heurística de gerenciamento de temperatura proporcional, integral e derivativa (PIDTM); (iii) uma heurística de gerenciamento de temperatura tendo por função custo restrições de energia (TMEC). TEA possibilitou o monitoramento preciso da temperatura em tempo de execução no many-core de referência, permitindo a validação das propostas de DTM. O PIDTM reduziu em até 7,15% a temperatura de pico em um cenário de alta carga de trabalho, enquanto o TMEC melhorou em até 82,9% a vida útil esperada do sistema. |
id |
P_RS_b71918409b7ce3b5dc9a5bb4a55e411b |
---|---|
oai_identifier_str |
oai:tede2.pucrs.br:tede/9831 |
network_acronym_str |
P_RS |
network_name_str |
Biblioteca Digital de Teses e Dissertações da PUC_RS |
repository_id_str |
|
spelling |
Moraes, Fernando Gehmhttp://lattes.cnpq.br/2509301929350826Martins, André Luís del Mestrehttp://lattes.cnpq.br/8570090119222585http://lattes.cnpq.br/7440082672087018Silva, Alzemiro Henrique Lucas da2021-09-01T12:39:55Z2021-08-12http://tede2.pucrs.br/tede2/handle/tede/9831Nodos tecnológicos recentes permitem fabricar bilhões de transistores em uma pequena área de silício, replicando estruturas idênticas, resultando em sistemas manycore. No entanto, a densidade de potência pode limitar a quantidade de potência que o sistema pode consumir. Um many-core em seu desempenho máximo pode levar a violar temperatura segura e, consequentemente, resultar em problemas de confiabilidade. Técnicas de gerenciamento térmico dinâmico (DTM) foram propostas para garantir que sistemas many-core funcionem com bom desempenho sem comprometer a confiabilidade. Técnicas DTM dependem de dados precisos de monitoramento de temperatura. Esta Tese revisa trabalhos recentes de DTM e propõe um novo método para permitir o monitoramento da temperatura em tempo de execução em um sistema many-core, novas heurísticas tendo por função custo a temperatura, bem como métodos de atuação, mapeamento e migração de tarefas e controle dinâmico de frequência e tensão (DVFS). Os trabalhos do estado-daarte sobre técnicas de DTM apresentam heurísticas complexas de atuação em tempo de execução, com foco principalmente no mapeamento de tarefas, e não se apresentam métodos de monitoramento de temperatura, comprometendo a aplicabilidade em sistemas reais. O estado da arte também apresenta trabalhos voltados ao gerenciamento dinâmico de confiabilidade (DRM), onde o objetivo principal é garantir maior confiabilidade ao sistema, utilizando as mesmas técnicas de atuação para controlar a temperatura. Esta Tese também revisa alguns dos efeitos de envelhecimento em circuitos integrados e analisa resultados de confiabilidade relacionados ao tempo de vida para as heurísticas propostas. As principais contribuições desta Tese incluem: (i) um acelerador de hardware para estimativa térmica (TEA), (ii) uma heurística de gerenciamento de temperatura proporcional, integral e derivativa (PIDTM); (iii) uma heurística de gerenciamento de temperatura tendo por função custo restrições de energia (TMEC). TEA possibilitou o monitoramento preciso da temperatura em tempo de execução no many-core de referência, permitindo a validação das propostas de DTM. O PIDTM reduziu em até 7,15% a temperatura de pico em um cenário de alta carga de trabalho, enquanto o TMEC melhorou em até 82,9% a vida útil esperada do sistema.Recent technology nodes enable to deploy billions of transistors in a small silicon area by replicating identical structures, resulting in many-core systems. However, power density may limit the amount of power the system can consume. A many-core at its maximum performance may lead to violate safe temperature definition and, consequently, result in reliability issues. Dynamic Thermal Management (DTM) techniques have been proposed to guarantee that many-core systems run at good performance without compromising reliability. DTM techniques rely on accurate temperature monitoring data. This Thesis reviews recent DTM works and proposes a new method to enable runtime temperature monitoring in a many-core system and new heuristics for thermal-aware application mapping, migration, and dynamic frequency and voltage scaling (DVFS) actuation, considering temperature and energy consumption. The state-of-art study on DTM techniques presents complex mechanisms for runtime actuation, focusing mainly on task mapping, and shows no concern about temperature monitoring methods, compromising the applicability in real systems. The stateof-art also presents works targeting dynamic reliability management (DRM), where the main objective is to ensure longer lifetime for the system, using the same actuation knobs used to control the temperature. This thesis also reviews some of the aging effects and analyses the lifetime reliability results for the proposed heuristics. The main contributions of this Thesis include: (i) a thermal estimation accelerator (TEA), (ii) a proportional, integral and derivative temperature management (PIDTM) heuristic; (iii) a temperature management heuristic having as cost function energy constraints (TMEC). TEA enabled accurate runtime temperature monitoring in the reference many-core, enabling the validation of the DTM proposals. PIDTM reduced up to 7.15% the overall peak temperature in a high workload scenario, while TMEC improved up to 82.9% in the system’s expected lifetime.Submitted by PPG Ciência da Computação (ppgcc@pucrs.br) on 2021-08-31T20:02:36Z No. of bitstreams: 1 ALZEMIRO HENRIQUE LUCAS DA SILVA_TES.pdf: 7365980 bytes, checksum: cddc3c92cc8350eb514a212342cb6d6d (MD5)Approved for entry into archive by Sheila Dias (sheila.dias@pucrs.br) on 2021-09-01T12:30:58Z (GMT) No. of bitstreams: 1 ALZEMIRO HENRIQUE LUCAS DA SILVA_TES.pdf: 7365980 bytes, checksum: cddc3c92cc8350eb514a212342cb6d6d (MD5)Made available in DSpace on 2021-09-01T12:39:55Z (GMT). No. of bitstreams: 1 ALZEMIRO HENRIQUE LUCAS DA SILVA_TES.pdf: 7365980 bytes, checksum: cddc3c92cc8350eb514a212342cb6d6d (MD5) Previous issue date: 2021-08-12Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPESapplication/pdfhttp://tede2.pucrs.br:80/tede2/retrieve/181865/ALZEMIRO%20HENRIQUE%20LUCAS%20DA%20SILVA_TES.pdf.jpgengPontifícia Universidade Católica do Rio Grande do SulPrograma de Pós-Graduação em Ciência da ComputaçãoPUCRSBrasilEscola PolitécnicaMany-core SystemsTemperature MonitoringDynamic Thermal ManagementLifetime ReliabilityMappingSistemas Many-coreMonitoramento de TemperaturaGerenciamento Dinâmico da TemperaturaConfiabilidade de Tempo de VidaMapeamentoCIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAODynamic thermal management for noc-based many-core systemsGerenciamento térmico dinâmico em sistemas many-core baseados em redes intra chipinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisTrabalho não apresenta restrição para publicação-4570527706994352458500500600-8620782570833253013590462550136975366info:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da PUC_RSinstname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)instacron:PUC_RSTHUMBNAILALZEMIRO HENRIQUE LUCAS DA SILVA_TES.pdf.jpgALZEMIRO HENRIQUE LUCAS DA SILVA_TES.pdf.jpgimage/jpeg5394http://tede2.pucrs.br/tede2/bitstream/tede/9831/4/ALZEMIRO+HENRIQUE+LUCAS+DA+SILVA_TES.pdf.jpg947bccdcc79434008ca7c754b51964c8MD54TEXTALZEMIRO HENRIQUE LUCAS DA SILVA_TES.pdf.txtALZEMIRO HENRIQUE LUCAS DA SILVA_TES.pdf.txttext/plain249776http://tede2.pucrs.br/tede2/bitstream/tede/9831/3/ALZEMIRO+HENRIQUE+LUCAS+DA+SILVA_TES.pdf.txt8afc50ca7c48fd7c2ed0e952165ea0c0MD53ORIGINALALZEMIRO HENRIQUE LUCAS DA SILVA_TES.pdfALZEMIRO HENRIQUE LUCAS DA SILVA_TES.pdfapplication/pdf7365980http://tede2.pucrs.br/tede2/bitstream/tede/9831/2/ALZEMIRO+HENRIQUE+LUCAS+DA+SILVA_TES.pdfcddc3c92cc8350eb514a212342cb6d6dMD52LICENSElicense.txtlicense.txttext/plain; charset=utf-8590http://tede2.pucrs.br/tede2/bitstream/tede/9831/1/license.txt220e11f2d3ba5354f917c7035aadef24MD51tede/98312021-09-01 12:00:25.336oai:tede2.pucrs.br:tede/9831QXV0b3JpemE/P28gcGFyYSBQdWJsaWNhPz9vIEVsZXRyP25pY2E6IENvbSBiYXNlIG5vIGRpc3Bvc3RvIG5hIExlaSBGZWRlcmFsIG4/OS42MTAsIGRlIDE5IGRlIGZldmVyZWlybyBkZSAxOTk4LCBvIGF1dG9yIEFVVE9SSVpBIGEgcHVibGljYT8/byBlbGV0cj9uaWNhIGRhIHByZXNlbnRlIG9icmEgbm8gYWNlcnZvIGRhIEJpYmxpb3RlY2EgRGlnaXRhbCBkYSBQb250aWY/Y2lhIFVuaXZlcnNpZGFkZSBDYXQ/bGljYSBkbyBSaW8gR3JhbmRlIGRvIFN1bCwgc2VkaWFkYSBhIEF2LiBJcGlyYW5nYSA2NjgxLCBQb3J0byBBbGVncmUsIFJpbyBHcmFuZGUgZG8gU3VsLCBjb20gcmVnaXN0cm8gZGUgQ05QSiA4ODYzMDQxMzAwMDItODEgYmVtIGNvbW8gZW0gb3V0cmFzIGJpYmxpb3RlY2FzIGRpZ2l0YWlzLCBuYWNpb25haXMgZSBpbnRlcm5hY2lvbmFpcywgY29ucz9yY2lvcyBlIHJlZGVzID9zIHF1YWlzIGEgYmlibGlvdGVjYSBkYSBQVUNSUyBwb3NzYSBhIHZpciBwYXJ0aWNpcGFyLCBzZW0gP251cyBhbHVzaXZvIGFvcyBkaXJlaXRvcyBhdXRvcmFpcywgYSB0P3R1bG8gZGUgZGl2dWxnYT8/byBkYSBwcm9kdT8/byBjaWVudD9maWNhLgo=Biblioteca Digital de Teses e Dissertaçõeshttp://tede2.pucrs.br/tede2/PRIhttps://tede2.pucrs.br/oai/requestbiblioteca.central@pucrs.br||opendoar:2021-09-01T15:00:25Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)false |
dc.title.por.fl_str_mv |
Dynamic thermal management for noc-based many-core systems |
dc.title.alternative.por.fl_str_mv |
Gerenciamento térmico dinâmico em sistemas many-core baseados em redes intra chip |
title |
Dynamic thermal management for noc-based many-core systems |
spellingShingle |
Dynamic thermal management for noc-based many-core systems Silva, Alzemiro Henrique Lucas da Many-core Systems Temperature Monitoring Dynamic Thermal Management Lifetime Reliability Mapping Sistemas Many-core Monitoramento de Temperatura Gerenciamento Dinâmico da Temperatura Confiabilidade de Tempo de Vida Mapeamento CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO |
title_short |
Dynamic thermal management for noc-based many-core systems |
title_full |
Dynamic thermal management for noc-based many-core systems |
title_fullStr |
Dynamic thermal management for noc-based many-core systems |
title_full_unstemmed |
Dynamic thermal management for noc-based many-core systems |
title_sort |
Dynamic thermal management for noc-based many-core systems |
author |
Silva, Alzemiro Henrique Lucas da |
author_facet |
Silva, Alzemiro Henrique Lucas da |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Moraes, Fernando Gehm |
dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/2509301929350826 |
dc.contributor.advisor-co1.fl_str_mv |
Martins, André Luís del Mestre |
dc.contributor.advisor-co1Lattes.fl_str_mv |
http://lattes.cnpq.br/8570090119222585 |
dc.contributor.authorLattes.fl_str_mv |
http://lattes.cnpq.br/7440082672087018 |
dc.contributor.author.fl_str_mv |
Silva, Alzemiro Henrique Lucas da |
contributor_str_mv |
Moraes, Fernando Gehm Martins, André Luís del Mestre |
dc.subject.eng.fl_str_mv |
Many-core Systems Temperature Monitoring Dynamic Thermal Management Lifetime Reliability Mapping |
topic |
Many-core Systems Temperature Monitoring Dynamic Thermal Management Lifetime Reliability Mapping Sistemas Many-core Monitoramento de Temperatura Gerenciamento Dinâmico da Temperatura Confiabilidade de Tempo de Vida Mapeamento CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO |
dc.subject.por.fl_str_mv |
Sistemas Many-core Monitoramento de Temperatura Gerenciamento Dinâmico da Temperatura Confiabilidade de Tempo de Vida Mapeamento |
dc.subject.cnpq.fl_str_mv |
CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO |
description |
Nodos tecnológicos recentes permitem fabricar bilhões de transistores em uma pequena área de silício, replicando estruturas idênticas, resultando em sistemas manycore. No entanto, a densidade de potência pode limitar a quantidade de potência que o sistema pode consumir. Um many-core em seu desempenho máximo pode levar a violar temperatura segura e, consequentemente, resultar em problemas de confiabilidade. Técnicas de gerenciamento térmico dinâmico (DTM) foram propostas para garantir que sistemas many-core funcionem com bom desempenho sem comprometer a confiabilidade. Técnicas DTM dependem de dados precisos de monitoramento de temperatura. Esta Tese revisa trabalhos recentes de DTM e propõe um novo método para permitir o monitoramento da temperatura em tempo de execução em um sistema many-core, novas heurísticas tendo por função custo a temperatura, bem como métodos de atuação, mapeamento e migração de tarefas e controle dinâmico de frequência e tensão (DVFS). Os trabalhos do estado-daarte sobre técnicas de DTM apresentam heurísticas complexas de atuação em tempo de execução, com foco principalmente no mapeamento de tarefas, e não se apresentam métodos de monitoramento de temperatura, comprometendo a aplicabilidade em sistemas reais. O estado da arte também apresenta trabalhos voltados ao gerenciamento dinâmico de confiabilidade (DRM), onde o objetivo principal é garantir maior confiabilidade ao sistema, utilizando as mesmas técnicas de atuação para controlar a temperatura. Esta Tese também revisa alguns dos efeitos de envelhecimento em circuitos integrados e analisa resultados de confiabilidade relacionados ao tempo de vida para as heurísticas propostas. As principais contribuições desta Tese incluem: (i) um acelerador de hardware para estimativa térmica (TEA), (ii) uma heurística de gerenciamento de temperatura proporcional, integral e derivativa (PIDTM); (iii) uma heurística de gerenciamento de temperatura tendo por função custo restrições de energia (TMEC). TEA possibilitou o monitoramento preciso da temperatura em tempo de execução no many-core de referência, permitindo a validação das propostas de DTM. O PIDTM reduziu em até 7,15% a temperatura de pico em um cenário de alta carga de trabalho, enquanto o TMEC melhorou em até 82,9% a vida útil esperada do sistema. |
publishDate |
2021 |
dc.date.accessioned.fl_str_mv |
2021-09-01T12:39:55Z |
dc.date.issued.fl_str_mv |
2021-08-12 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://tede2.pucrs.br/tede2/handle/tede/9831 |
url |
http://tede2.pucrs.br/tede2/handle/tede/9831 |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.relation.program.fl_str_mv |
-4570527706994352458 |
dc.relation.confidence.fl_str_mv |
500 500 600 |
dc.relation.cnpq.fl_str_mv |
-862078257083325301 |
dc.relation.sponsorship.fl_str_mv |
3590462550136975366 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Pontifícia Universidade Católica do Rio Grande do Sul |
dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Ciência da Computação |
dc.publisher.initials.fl_str_mv |
PUCRS |
dc.publisher.country.fl_str_mv |
Brasil |
dc.publisher.department.fl_str_mv |
Escola Politécnica |
publisher.none.fl_str_mv |
Pontifícia Universidade Católica do Rio Grande do Sul |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da PUC_RS instname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS) instacron:PUC_RS |
instname_str |
Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS) |
instacron_str |
PUC_RS |
institution |
PUC_RS |
reponame_str |
Biblioteca Digital de Teses e Dissertações da PUC_RS |
collection |
Biblioteca Digital de Teses e Dissertações da PUC_RS |
bitstream.url.fl_str_mv |
http://tede2.pucrs.br/tede2/bitstream/tede/9831/4/ALZEMIRO+HENRIQUE+LUCAS+DA+SILVA_TES.pdf.jpg http://tede2.pucrs.br/tede2/bitstream/tede/9831/3/ALZEMIRO+HENRIQUE+LUCAS+DA+SILVA_TES.pdf.txt http://tede2.pucrs.br/tede2/bitstream/tede/9831/2/ALZEMIRO+HENRIQUE+LUCAS+DA+SILVA_TES.pdf http://tede2.pucrs.br/tede2/bitstream/tede/9831/1/license.txt |
bitstream.checksum.fl_str_mv |
947bccdcc79434008ca7c754b51964c8 8afc50ca7c48fd7c2ed0e952165ea0c0 cddc3c92cc8350eb514a212342cb6d6d 220e11f2d3ba5354f917c7035aadef24 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS) |
repository.mail.fl_str_mv |
biblioteca.central@pucrs.br|| |
_version_ |
1799765351631683584 |