AccNoSys: uma arquitetura adaptativa aceleradora com Interconexão baseada em rede em chip

Cruz, Marcos Oliveira da

AccNoSys: uma arquitetura adaptativa aceleradora com Interconexão baseada em rede em chip

Detalhes bibliográficos
Autor(a) principal:	Cruz, Marcos Oliveira da
Data de Publicação:	2016
Tipo de documento:	Dissertação
Idioma:	por
Título da fonte:	Repositório Institucional da UFRN
Texto Completo:	https://repositorio.ufrn.br/jspui/handle/123456789/25643
Resumo:	A evolução dos processadores tem sido marcada pela crescente demanda por desempenho para atender as aplicações cada vez maiores e mais complexas. Juntamente com essa necessidade de desempenho, a heterogeneidade das aplicações exige também uma grande flexibilidade dos processadores. Os processadores convencionais são capazes de fornecer desempenho ou flexibilidade, mas sempre privilegiando um desses aspectos em detrimento do outro. Arquiteturas adaptativas aceleradoras de granularidade grossa têm sido propostas como uma solução capaz de oferecer, ao mesmo tempo, flexibilidade e desempenho. No entanto, um dos principais desafios desse tipo de arquitetura é o mapeamento de aplicações que é um problema NP-Completo. Dentre os fatores que contribuem para essa complexidade está o modelo de interconexão utilizado, que normalmente, se baseia em crossbar ou algum modelo próximo ao crossbar. Técnicas de exploração de paralelismo, como software pipelining, também são usadas para atingir melhor desempenho. Essas técnicas aumentam ainda mais a complexidade dos algoritmos de mapeamento. Este trabalho apresenta uma arquitetura adaptativa que utiliza um mecanismo de comunicação baseado em envio de pacotes para interconectar unidades funcionais. A arquitetura combinada com o modelo de interconexão é capaz de explorar paralelismo em dois níveis, a saber, ILP (incluindo técnicas de software pipeline) e TLP. O mapeamento das aplicações deve ser efetuado em tempo de compilação utilizando um algoritmo desenvolvido para a arquitetura de complexidade O(1). A arquitetura foi implementada em SystemC e a execução de diversas aplicações foi simulada, explorando tanto ILP quanto TLP. As simulações obtiveram, em média, 41% de ganho de desempenho em comparação com um processador RISC de 8 estágios de pipeline. Os resultados obtidos nas simulações confirmam que é possível explorar o paralelismo inerente das aplicações. Além disso a partir da escolha do modelo de mapeamento (como exploração de threads, ou de paralelismo no nível de instruções, laços, etc) é possível obter diferentes resultados através da adaptação da arquitetura a aplicação.

Metadados do item

id	UFRN_9ed0e2b8289a9f7e4d9b3a7353645db5
oai_identifier_str	oai:https://repositorio.ufrn.br:123456789/25643
network_acronym_str	UFRN
network_name_str	Repositório Institucional da UFRN
repository_id_str
spelling	Cruz, Marcos Oliveira daKreutz, Marcio EduardoSilva, Ivan SaraivaAraújo, Silvio Roberto Fernandes dePereira, Mônica Magalhães2018-07-31T10:52:00Z2018-07-31T10:52:00Z2016-01-22CRUZ, Marcos Oliveira da. AccNoSys: uma arquitetura adaptativa aceleradora com interconexão baseada em rede em chip. 2016. 94f. Dissertação (Mestrado em Sistemas e Computação) - Centro de Ciências Exatas e da Terra, Universidade Federal do Rio Grande do Norte, Natal, 2016.https://repositorio.ufrn.br/jspui/handle/123456789/25643A evolução dos processadores tem sido marcada pela crescente demanda por desempenho para atender as aplicações cada vez maiores e mais complexas. Juntamente com essa necessidade de desempenho, a heterogeneidade das aplicações exige também uma grande flexibilidade dos processadores. Os processadores convencionais são capazes de fornecer desempenho ou flexibilidade, mas sempre privilegiando um desses aspectos em detrimento do outro. Arquiteturas adaptativas aceleradoras de granularidade grossa têm sido propostas como uma solução capaz de oferecer, ao mesmo tempo, flexibilidade e desempenho. No entanto, um dos principais desafios desse tipo de arquitetura é o mapeamento de aplicações que é um problema NP-Completo. Dentre os fatores que contribuem para essa complexidade está o modelo de interconexão utilizado, que normalmente, se baseia em crossbar ou algum modelo próximo ao crossbar. Técnicas de exploração de paralelismo, como software pipelining, também são usadas para atingir melhor desempenho. Essas técnicas aumentam ainda mais a complexidade dos algoritmos de mapeamento. Este trabalho apresenta uma arquitetura adaptativa que utiliza um mecanismo de comunicação baseado em envio de pacotes para interconectar unidades funcionais. A arquitetura combinada com o modelo de interconexão é capaz de explorar paralelismo em dois níveis, a saber, ILP (incluindo técnicas de software pipeline) e TLP. O mapeamento das aplicações deve ser efetuado em tempo de compilação utilizando um algoritmo desenvolvido para a arquitetura de complexidade O(1). A arquitetura foi implementada em SystemC e a execução de diversas aplicações foi simulada, explorando tanto ILP quanto TLP. As simulações obtiveram, em média, 41% de ganho de desempenho em comparação com um processador RISC de 8 estágios de pipeline. Os resultados obtidos nas simulações confirmam que é possível explorar o paralelismo inerente das aplicações. Além disso a partir da escolha do modelo de mapeamento (como exploração de threads, ou de paralelismo no nível de instruções, laços, etc) é possível obter diferentes resultados através da adaptação da arquitetura a aplicação.A evolução dos processadores tem sido marcada pela crescente demanda por desempenho para atender as aplicações cada vez maiores e mais complexas. Juntamente com essa necessidade de desempenho, a heterogeneidade das aplicações exige também uma grande flexibilidade dos processadores. Os processadores convencionais são capazes de fornecer desempenho ou flexibilidade, mas sempre privilegiando um desses aspectos em detrimento do outro. Arquiteturas adaptativas aceleradoras de granularidade grossa têm sido propostas como uma solução capaz de oferecer, ao mesmo tempo, flexibilidade e desempenho. No entanto, um dos principais desafios desse tipo de arquitetura é o mapeamento de aplicações que é um problema NP-Completo. Dentre os fatores que contribuem para essa complexidade está o modelo de interconexão utilizado, que normalmente, se baseia em crossbar ou algum modelo próximo ao crossbar. Técnicas de exploração de paralelismo, como software pipelining, também são usadas para atingir melhor desempenho. Essas técnicas aumentam ainda mais a complexidade dos algoritmos de mapeamento. Este trabalho apresenta uma arquitetura adaptativa que utiliza um mecanismo de comunicação baseado em envio de pacotes para interconectar unidades funcionais. A arquitetura combinada com o modelo de interconexão é capaz de explorar paralelismo em dois níveis, a saber, ILP (incluindo técnicas de software pipeline) e TLP. O mapeamento das aplicações deve ser efetuado em tempo de compilação utilizando um algoritmo desenvolvido para a arquitetura de complexidade O(1). A arquitetura foi implementada em SystemC e a execução de diversas aplicações foi simulada, explorando tanto ILP quanto TLP. As simulações obtiveram, em média, 41% de ganho de desempenho em comparação com um processador RISC de 8 estágios de pipeline. Os resultados obtidos nas simulações confirmam que é possível explorar o paralelismo inerente das aplicações. Além disso a partir da escolha do modelo de mapeamento (como exploração de threads, ou de paralelismo no nível de instruções, laços, etc) é possível obter diferentes resultados através da adaptação da arquitetura a aplicação.porCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAOArquitetura adaptativaModelo de interconexãoMapeamentoRede-em-chipParalelismoRanularidade grossaAccNoSys: uma arquitetura adaptativa aceleradora com Interconexão baseada em rede em chipinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisPROGRAMA DE PÓS-GRADUAÇÃO EM SISTEMAS E COMPUTAÇÃOUFRNBrasilinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRNinstname:Universidade Federal do Rio Grande do Norte (UFRN)instacron:UFRNORIGINALMarcosOliveiraDaCruz_DISSERT.pdfapplication/pdf4332421https://repositorio.ufrn.br/bitstream/123456789/25643/1/MarcosOliveiraDaCruz_DISSERT.pdf11b304b7cc6ad671b40e493871db983dMD51TEXTMarcosOliveiraDaCruz_DISSERT.pdf.txtMarcosOliveiraDaCruz_DISSERT.pdf.txtExtracted texttext/plain160021https://repositorio.ufrn.br/bitstream/123456789/25643/2/MarcosOliveiraDaCruz_DISSERT.pdf.txtb169bd326a25b8aa5df82f8ae2706a91MD52THUMBNAILMarcosOliveiraDaCruz_DISSERT.pdf.jpgMarcosOliveiraDaCruz_DISSERT.pdf.jpgIM Thumbnailimage/jpeg3137https://repositorio.ufrn.br/bitstream/123456789/25643/3/MarcosOliveiraDaCruz_DISSERT.pdf.jpgfa644162254edc80fac45fd6ef682a86MD53123456789/256432019-01-30 07:21:24.619oai:https://repositorio.ufrn.br:123456789/25643Repositório de PublicaçõesPUBhttp://repositorio.ufrn.br/oai/opendoar:2019-01-30T10:21:24Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)false
dc.title.pt_BR.fl_str_mv	AccNoSys: uma arquitetura adaptativa aceleradora com Interconexão baseada em rede em chip
title	AccNoSys: uma arquitetura adaptativa aceleradora com Interconexão baseada em rede em chip
spellingShingle	AccNoSys: uma arquitetura adaptativa aceleradora com Interconexão baseada em rede em chip Cruz, Marcos Oliveira da CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO Arquitetura adaptativa Modelo de interconexão Mapeamento Rede-em-chip Paralelismo Ranularidade grossa
title_short	AccNoSys: uma arquitetura adaptativa aceleradora com Interconexão baseada em rede em chip
title_full	AccNoSys: uma arquitetura adaptativa aceleradora com Interconexão baseada em rede em chip
title_fullStr	AccNoSys: uma arquitetura adaptativa aceleradora com Interconexão baseada em rede em chip
title_full_unstemmed	AccNoSys: uma arquitetura adaptativa aceleradora com Interconexão baseada em rede em chip
title_sort	AccNoSys: uma arquitetura adaptativa aceleradora com Interconexão baseada em rede em chip
author	Cruz, Marcos Oliveira da
author_facet	Cruz, Marcos Oliveira da
author_role	author
dc.contributor.authorID.pt_BR.fl_str_mv
dc.contributor.advisorID.pt_BR.fl_str_mv
dc.contributor.referees1.none.fl_str_mv	Kreutz, Marcio Eduardo
dc.contributor.referees1ID.pt_BR.fl_str_mv
dc.contributor.referees2.none.fl_str_mv	Silva, Ivan Saraiva
dc.contributor.referees2ID.pt_BR.fl_str_mv
dc.contributor.referees3.none.fl_str_mv	Araújo, Silvio Roberto Fernandes de
dc.contributor.referees3ID.pt_BR.fl_str_mv
dc.contributor.author.fl_str_mv	Cruz, Marcos Oliveira da
dc.contributor.advisor1.fl_str_mv	Pereira, Mônica Magalhães
contributor_str_mv	Pereira, Mônica Magalhães
dc.subject.cnpq.fl_str_mv	CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
topic	CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO Arquitetura adaptativa Modelo de interconexão Mapeamento Rede-em-chip Paralelismo Ranularidade grossa
dc.subject.por.fl_str_mv	Arquitetura adaptativa Modelo de interconexão Mapeamento Rede-em-chip Paralelismo Ranularidade grossa
description	A evolução dos processadores tem sido marcada pela crescente demanda por desempenho para atender as aplicações cada vez maiores e mais complexas. Juntamente com essa necessidade de desempenho, a heterogeneidade das aplicações exige também uma grande flexibilidade dos processadores. Os processadores convencionais são capazes de fornecer desempenho ou flexibilidade, mas sempre privilegiando um desses aspectos em detrimento do outro. Arquiteturas adaptativas aceleradoras de granularidade grossa têm sido propostas como uma solução capaz de oferecer, ao mesmo tempo, flexibilidade e desempenho. No entanto, um dos principais desafios desse tipo de arquitetura é o mapeamento de aplicações que é um problema NP-Completo. Dentre os fatores que contribuem para essa complexidade está o modelo de interconexão utilizado, que normalmente, se baseia em crossbar ou algum modelo próximo ao crossbar. Técnicas de exploração de paralelismo, como software pipelining, também são usadas para atingir melhor desempenho. Essas técnicas aumentam ainda mais a complexidade dos algoritmos de mapeamento. Este trabalho apresenta uma arquitetura adaptativa que utiliza um mecanismo de comunicação baseado em envio de pacotes para interconectar unidades funcionais. A arquitetura combinada com o modelo de interconexão é capaz de explorar paralelismo em dois níveis, a saber, ILP (incluindo técnicas de software pipeline) e TLP. O mapeamento das aplicações deve ser efetuado em tempo de compilação utilizando um algoritmo desenvolvido para a arquitetura de complexidade O(1). A arquitetura foi implementada em SystemC e a execução de diversas aplicações foi simulada, explorando tanto ILP quanto TLP. As simulações obtiveram, em média, 41% de ganho de desempenho em comparação com um processador RISC de 8 estágios de pipeline. Os resultados obtidos nas simulações confirmam que é possível explorar o paralelismo inerente das aplicações. Além disso a partir da escolha do modelo de mapeamento (como exploração de threads, ou de paralelismo no nível de instruções, laços, etc) é possível obter diferentes resultados através da adaptação da arquitetura a aplicação.
publishDate	2016
dc.date.issued.fl_str_mv	2016-01-22
dc.date.accessioned.fl_str_mv	2018-07-31T10:52:00Z
dc.date.available.fl_str_mv	2018-07-31T10:52:00Z
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.citation.fl_str_mv	CRUZ, Marcos Oliveira da. AccNoSys: uma arquitetura adaptativa aceleradora com interconexão baseada em rede em chip. 2016. 94f. Dissertação (Mestrado em Sistemas e Computação) - Centro de Ciências Exatas e da Terra, Universidade Federal do Rio Grande do Norte, Natal, 2016.
dc.identifier.uri.fl_str_mv	https://repositorio.ufrn.br/jspui/handle/123456789/25643
identifier_str_mv	CRUZ, Marcos Oliveira da. AccNoSys: uma arquitetura adaptativa aceleradora com interconexão baseada em rede em chip. 2016. 94f. Dissertação (Mestrado em Sistemas e Computação) - Centro de Ciências Exatas e da Terra, Universidade Federal do Rio Grande do Norte, Natal, 2016.
url	https://repositorio.ufrn.br/jspui/handle/123456789/25643
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.publisher.program.fl_str_mv	PROGRAMA DE PÓS-GRADUAÇÃO EM SISTEMAS E COMPUTAÇÃO
dc.publisher.initials.fl_str_mv	UFRN
dc.publisher.country.fl_str_mv	Brasil
dc.source.none.fl_str_mv	reponame:Repositório Institucional da UFRN instname:Universidade Federal do Rio Grande do Norte (UFRN) instacron:UFRN
instname_str	Universidade Federal do Rio Grande do Norte (UFRN)
instacron_str	UFRN
institution	UFRN
reponame_str	Repositório Institucional da UFRN
collection	Repositório Institucional da UFRN
bitstream.url.fl_str_mv	https://repositorio.ufrn.br/bitstream/123456789/25643/1/MarcosOliveiraDaCruz_DISSERT.pdf https://repositorio.ufrn.br/bitstream/123456789/25643/2/MarcosOliveiraDaCruz_DISSERT.pdf.txt https://repositorio.ufrn.br/bitstream/123456789/25643/3/MarcosOliveiraDaCruz_DISSERT.pdf.jpg
bitstream.checksum.fl_str_mv	11b304b7cc6ad671b40e493871db983d b169bd326a25b8aa5df82f8ae2706a91 fa644162254edc80fac45fd6ef682a86
bitstream.checksumAlgorithm.fl_str_mv	MD5 MD5 MD5
repository.name.fl_str_mv	Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)
repository.mail.fl_str_mv
_version_	1802117764509335552

AccNoSys: uma arquitetura adaptativa aceleradora com Interconexão baseada em rede em chip

Registros relacionados