Distributed memory organization with support for data migration for noc-based MPSOCS
Autor(a) principal: | |
---|---|
Data de Publicação: | 2012 |
Tipo de documento: | Dissertação |
Idioma: | eng |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da PUC_RS |
Texto Completo: | http://tede2.pucrs.br/tede2/handle/tede/5167 |
Resumo: | The evolution in the deployment of semiconductor technology has enabled the development of System-on-Chip (SoCs) that integrate several processing elements (PEs) and memory modules in a single chip. SoCs that integrate several PEs are referred as Multiprocessor System-on-Chip (MPSoCs). As the number of PEs increases in an MPSoC, techniques that present low energy consumption, low latency and scalability become necessary. In NoC-based MPsoCs that adopt the Shared Memory model in the L2 cache, as the number of PEs increases, the number of accesses to memory modules also increases. This makes memory organization one of the most critical components of the system because it can present high energy consumption and high latency. Such factors may limit the use and scalability of MPSoC systems. Among the factors that contribute to increase latency and energy consumption in memory organizations are: the cache coherence protocol and the mapping of application's data. This work proposes the use of a cache memory organization that presents non-uniform access latency, where accesses to the L1 cache can target different L2 cache banks (NUCA non uniform cache access architecture), as a function of the address being accessed. Additionally, this work proposes the exploration of the physical services provided by the network-on-chip, such as multicast and priorities, to optimize the implementation of a directory-based cache coherence protocol. The obtained results show an average reduction of 39% in communication energy consumption and 17% reduction in latency for transactions of the cache coherence protocol when exploring NoC services. To improve placement of application's data, a data migration protocol is proposed. The goal of the protocol is to approximate L2 cache blocks to PEs that are mostly accessing it, moving blocks to a closer L2 cache bank, if available. By using a data migration protocol, an average reduction of 29% was obtained in the energy consumption of cache accesses. |
id |
P_RS_7b51df8a20adf2141a5c96e69c42dd62 |
---|---|
oai_identifier_str |
oai:tede2.pucrs.br:tede/5167 |
network_acronym_str |
P_RS |
network_name_str |
Biblioteca Digital de Teses e Dissertações da PUC_RS |
repository_id_str |
|
spelling |
Moraes, Fernando GehmCPF:47776382000http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4782943Z2CPF:01838222006http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4208647E8Chaves, Tales Marchesan2015-04-14T14:49:44Z2015-04-102012-01-23CHAVES, Tales Marchesan. Organização de memória distribuída com suporte à migraçao de dados para MPSOCS baseados em nocs. 2012. 90 f. Dissertação (Mestrado em Ciência da Computação) - Pontifícia Universidade Católica do Rio Grande do Sul, Porto Alegre, 2012.http://tede2.pucrs.br/tede2/handle/tede/5167The evolution in the deployment of semiconductor technology has enabled the development of System-on-Chip (SoCs) that integrate several processing elements (PEs) and memory modules in a single chip. SoCs that integrate several PEs are referred as Multiprocessor System-on-Chip (MPSoCs). As the number of PEs increases in an MPSoC, techniques that present low energy consumption, low latency and scalability become necessary. In NoC-based MPsoCs that adopt the Shared Memory model in the L2 cache, as the number of PEs increases, the number of accesses to memory modules also increases. This makes memory organization one of the most critical components of the system because it can present high energy consumption and high latency. Such factors may limit the use and scalability of MPSoC systems. Among the factors that contribute to increase latency and energy consumption in memory organizations are: the cache coherence protocol and the mapping of application's data. This work proposes the use of a cache memory organization that presents non-uniform access latency, where accesses to the L1 cache can target different L2 cache banks (NUCA non uniform cache access architecture), as a function of the address being accessed. Additionally, this work proposes the exploration of the physical services provided by the network-on-chip, such as multicast and priorities, to optimize the implementation of a directory-based cache coherence protocol. The obtained results show an average reduction of 39% in communication energy consumption and 17% reduction in latency for transactions of the cache coherence protocol when exploring NoC services. To improve placement of application's data, a data migration protocol is proposed. The goal of the protocol is to approximate L2 cache blocks to PEs that are mostly accessing it, moving blocks to a closer L2 cache bank, if available. By using a data migration protocol, an average reduction of 29% was obtained in the energy consumption of cache accesses.O avanço da tecnologia de semicondutores possibilitou o desenvolvimento de sistemas intra-chip (SoCs) que integram, em um mesmo chip, diversos elementos de processamento (PEs) e módulos de memória. SoCs que possuem mais de um PE são denominados de sistemas intra-chip multiprocesados (MPSoCs). À medida que o número de PEs aumenta em um MPSoC, torna-se necessário o uso de técnicas que resultem em um baixo consumo de energia, baixa latência na comunicação e escalabilidade. Em MPSoCs baseados em redes intra-chip, com blocos de memória compartilhada (cache L2), o aumento no número de PEs culmina no aumento da quantidade de acessos realizados a estes módulos. Isto torna a organização de memória um dos componentes mais críticos destes sistemas, tendo em vista que a mesma pode apresentar um alto consumo de energia e alta latência de resposta. Fatores como estes podem limitar o uso e a escalabilidade destes sistemas. Dentre os fatores que afetam o consumo de energia e a latência da organização de memória de um MPSoC estão: o protocolo de coerência de cache e o mapeamento dos dados de aplicações. Este trabalho propõe a utilização de uma organização de memória cache L1 que possui latência de acesso não uniforme, onde acessos realizados podem ser destinados a diferentes bancos de memória cache L2 (NUCA non uniform cache access architecture). Além disso, o presente trabalho explora os serviços físicos providos pela rede intra-chip, tais como multicast e prioridades, para otimizar a implementação de um protocolo de coerência de cache baseado em diretório. Os resultados obtidos mostram uma redução média de 39% no consumo de energia de comunicação e 17% de latência em transações do protocolo de coerência quando explorando serviços físicos oferecidos pela rede intra-chip. Além disso, a fim de melhorar o posicionamento de dados de aplicações, é proposto um protocolo de migração de dados que posiciona os dados utilizados por uma região de PEs em um banco de memória cache L2 próximo. Com a utilização deste protocolo, é possível obter uma redução média de 29% no consumo de energia nos acessos à memória cache L2.Made available in DSpace on 2015-04-14T14:49:44Z (GMT). No. of bitstreams: 1 438252.pdf: 1960381 bytes, checksum: f2fbe64a6e6d4c7fc9e87728e86cb0b8 (MD5) Previous issue date: 2012-01-23application/pdfhttp://tede2.pucrs.br:80/tede2/retrieve/15990/438252.pdf.jpgengPontifícia Universidade Católica do Rio Grande do SulPrograma de Pós-Graduação em Ciência da ComputaçãoPUCRSBRFaculdade de InformácaMEMÓRIA DE COMPUTADORMIGRAÇÃO DE DADOS (INFORMÁTICA)MULTIPROCESSADORESCIÊNCIA DA COMPUTACAOINFORMÁTICACNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAODistributed memory organization with support for data migration for noc-based MPSOCSOrganização de memória distribuída com suporte à migraçao de dados para MPSOCS baseados em nocsinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis19749965330812744705006001946639708616176246info:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da PUC_RSinstname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)instacron:PUC_RSTHUMBNAIL438252.pdf.jpg438252.pdf.jpgimage/jpeg4025http://tede2.pucrs.br/tede2/bitstream/tede/5167/3/438252.pdf.jpg3caf1dd2fc758ebc02c7226cb3ceb530MD53TEXT438252.pdf.txt438252.pdf.txttext/plain184346http://tede2.pucrs.br/tede2/bitstream/tede/5167/2/438252.pdf.txteca86bed2772ae52dd77fdbf7068dd92MD52ORIGINAL438252.pdfapplication/pdf1960381http://tede2.pucrs.br/tede2/bitstream/tede/5167/1/438252.pdff2fbe64a6e6d4c7fc9e87728e86cb0b8MD51tede/51672015-04-30 08:15:45.15oai:tede2.pucrs.br:tede/5167Biblioteca Digital de Teses e Dissertaçõeshttp://tede2.pucrs.br/tede2/PRIhttps://tede2.pucrs.br/oai/requestbiblioteca.central@pucrs.br||opendoar:2015-04-30T11:15:45Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)false |
dc.title.eng.fl_str_mv |
Distributed memory organization with support for data migration for noc-based MPSOCS |
dc.title.alternative.por.fl_str_mv |
Organização de memória distribuída com suporte à migraçao de dados para MPSOCS baseados em nocs |
title |
Distributed memory organization with support for data migration for noc-based MPSOCS |
spellingShingle |
Distributed memory organization with support for data migration for noc-based MPSOCS Chaves, Tales Marchesan MEMÓRIA DE COMPUTADOR MIGRAÇÃO DE DADOS (INFORMÁTICA) MULTIPROCESSADORES CIÊNCIA DA COMPUTACAO INFORMÁTICA CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
title_short |
Distributed memory organization with support for data migration for noc-based MPSOCS |
title_full |
Distributed memory organization with support for data migration for noc-based MPSOCS |
title_fullStr |
Distributed memory organization with support for data migration for noc-based MPSOCS |
title_full_unstemmed |
Distributed memory organization with support for data migration for noc-based MPSOCS |
title_sort |
Distributed memory organization with support for data migration for noc-based MPSOCS |
author |
Chaves, Tales Marchesan |
author_facet |
Chaves, Tales Marchesan |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Moraes, Fernando Gehm |
dc.contributor.advisor1ID.fl_str_mv |
CPF:47776382000 |
dc.contributor.advisor1Lattes.fl_str_mv |
http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4782943Z2 |
dc.contributor.authorID.fl_str_mv |
CPF:01838222006 |
dc.contributor.authorLattes.fl_str_mv |
http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4208647E8 |
dc.contributor.author.fl_str_mv |
Chaves, Tales Marchesan |
contributor_str_mv |
Moraes, Fernando Gehm |
dc.subject.eng.fl_str_mv |
MEMÓRIA DE COMPUTADOR MIGRAÇÃO DE DADOS (INFORMÁTICA) MULTIPROCESSADORES CIÊNCIA DA COMPUTACAO INFORMÁTICA |
topic |
MEMÓRIA DE COMPUTADOR MIGRAÇÃO DE DADOS (INFORMÁTICA) MULTIPROCESSADORES CIÊNCIA DA COMPUTACAO INFORMÁTICA CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
dc.subject.cnpq.fl_str_mv |
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
description |
The evolution in the deployment of semiconductor technology has enabled the development of System-on-Chip (SoCs) that integrate several processing elements (PEs) and memory modules in a single chip. SoCs that integrate several PEs are referred as Multiprocessor System-on-Chip (MPSoCs). As the number of PEs increases in an MPSoC, techniques that present low energy consumption, low latency and scalability become necessary. In NoC-based MPsoCs that adopt the Shared Memory model in the L2 cache, as the number of PEs increases, the number of accesses to memory modules also increases. This makes memory organization one of the most critical components of the system because it can present high energy consumption and high latency. Such factors may limit the use and scalability of MPSoC systems. Among the factors that contribute to increase latency and energy consumption in memory organizations are: the cache coherence protocol and the mapping of application's data. This work proposes the use of a cache memory organization that presents non-uniform access latency, where accesses to the L1 cache can target different L2 cache banks (NUCA non uniform cache access architecture), as a function of the address being accessed. Additionally, this work proposes the exploration of the physical services provided by the network-on-chip, such as multicast and priorities, to optimize the implementation of a directory-based cache coherence protocol. The obtained results show an average reduction of 39% in communication energy consumption and 17% reduction in latency for transactions of the cache coherence protocol when exploring NoC services. To improve placement of application's data, a data migration protocol is proposed. The goal of the protocol is to approximate L2 cache blocks to PEs that are mostly accessing it, moving blocks to a closer L2 cache bank, if available. By using a data migration protocol, an average reduction of 29% was obtained in the energy consumption of cache accesses. |
publishDate |
2012 |
dc.date.issued.fl_str_mv |
2012-01-23 |
dc.date.accessioned.fl_str_mv |
2015-04-14T14:49:44Z |
dc.date.available.fl_str_mv |
2015-04-10 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
CHAVES, Tales Marchesan. Organização de memória distribuída com suporte à migraçao de dados para MPSOCS baseados em nocs. 2012. 90 f. Dissertação (Mestrado em Ciência da Computação) - Pontifícia Universidade Católica do Rio Grande do Sul, Porto Alegre, 2012. |
dc.identifier.uri.fl_str_mv |
http://tede2.pucrs.br/tede2/handle/tede/5167 |
identifier_str_mv |
CHAVES, Tales Marchesan. Organização de memória distribuída com suporte à migraçao de dados para MPSOCS baseados em nocs. 2012. 90 f. Dissertação (Mestrado em Ciência da Computação) - Pontifícia Universidade Católica do Rio Grande do Sul, Porto Alegre, 2012. |
url |
http://tede2.pucrs.br/tede2/handle/tede/5167 |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.relation.program.fl_str_mv |
1974996533081274470 |
dc.relation.confidence.fl_str_mv |
500 600 |
dc.relation.department.fl_str_mv |
1946639708616176246 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Pontifícia Universidade Católica do Rio Grande do Sul |
dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Ciência da Computação |
dc.publisher.initials.fl_str_mv |
PUCRS |
dc.publisher.country.fl_str_mv |
BR |
dc.publisher.department.fl_str_mv |
Faculdade de Informáca |
publisher.none.fl_str_mv |
Pontifícia Universidade Católica do Rio Grande do Sul |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da PUC_RS instname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS) instacron:PUC_RS |
instname_str |
Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS) |
instacron_str |
PUC_RS |
institution |
PUC_RS |
reponame_str |
Biblioteca Digital de Teses e Dissertações da PUC_RS |
collection |
Biblioteca Digital de Teses e Dissertações da PUC_RS |
bitstream.url.fl_str_mv |
http://tede2.pucrs.br/tede2/bitstream/tede/5167/3/438252.pdf.jpg http://tede2.pucrs.br/tede2/bitstream/tede/5167/2/438252.pdf.txt http://tede2.pucrs.br/tede2/bitstream/tede/5167/1/438252.pdf |
bitstream.checksum.fl_str_mv |
3caf1dd2fc758ebc02c7226cb3ceb530 eca86bed2772ae52dd77fdbf7068dd92 f2fbe64a6e6d4c7fc9e87728e86cb0b8 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS) |
repository.mail.fl_str_mv |
biblioteca.central@pucrs.br|| |
_version_ |
1799765306013384704 |