Análise da hierarquia de memórias em GPGPUs

Conrad, Danilo Fukuda

Análise da hierarquia de memórias em GPGPUs

Detalhes bibliográficos
Autor(a) principal:	Conrad, Danilo Fukuda
Data de Publicação:	2010
Tipo de documento:	Trabalho de conclusão de curso
Idioma:	por
Título da fonte:	Repositório Institucional da UFRGS
Texto Completo:	http://hdl.handle.net/10183/26339
Resumo:	O uso de placas gráficas como elementos de co-processamento para obter alto desempenho em aplicações paralelas tem crescido cada vez mais nos últimos tempos. Diversos são os exemplos de aplicações que, fazendo uso dessas arquiteturas, obtiveram speedups de até duas ordens de magnitude. Isto é possível pois as GPUs (Graphics Processing Units) possuem uma arquitetura altamente paralela, especializada em processamento de elementos gráficos, que pode ser feito em grande parte paralelamente. Além disso, o surgimento de linguagens de programação e frameworks que facilitam a programação nessas arquiteturas tem sido outro fator chave em sua popularização. Entretanto, ainda é necessário um aprofundado conhecimento da arquitetura utilizada a fim de dimensionar as aplicações nela executadas. Este trabalho tem como objetivo analisar o impacto de diferentes otimizações no acesso à memória da GPU utilizado como caso de estudo a arquitetura CUDA da empresa NVIDIA.

Metadados do item

id	UFRGS-2_011f3bdeb83fd6539a1ed0b1b987b285
oai_identifier_str	oai:www.lume.ufrgs.br:10183/26339
network_acronym_str	UFRGS-2
network_name_str	Repositório Institucional da UFRGS
repository_id_str
spelling	Conrad, Danilo FukudaNavaux, Philippe Olivier Alexandre2010-10-14T04:19:19Z2010http://hdl.handle.net/10183/26339000757777O uso de placas gráficas como elementos de co-processamento para obter alto desempenho em aplicações paralelas tem crescido cada vez mais nos últimos tempos. Diversos são os exemplos de aplicações que, fazendo uso dessas arquiteturas, obtiveram speedups de até duas ordens de magnitude. Isto é possível pois as GPUs (Graphics Processing Units) possuem uma arquitetura altamente paralela, especializada em processamento de elementos gráficos, que pode ser feito em grande parte paralelamente. Além disso, o surgimento de linguagens de programação e frameworks que facilitam a programação nessas arquiteturas tem sido outro fator chave em sua popularização. Entretanto, ainda é necessário um aprofundado conhecimento da arquitetura utilizada a fim de dimensionar as aplicações nela executadas. Este trabalho tem como objetivo analisar o impacto de diferentes otimizações no acesso à memória da GPU utilizado como caso de estudo a arquitetura CUDA da empresa NVIDIA.The use of graphics cards as coprocessing elements in order to achieve high performance in parallel applications is growing in the last couple of years. There are many examples of applications which, using such architectures, have achieved up to 2 orders of magnitude speedups in their performance. This is possible because GPUs (Graphics Processing Units) have a highly parallel architecture, specialized in processing graphics elements, which are highly independent and can often be processed separately, in parallel. Tools for aiding developers such as higher level programming languages and frameworks are factors which helped GPUs gain popularity for general purpose computing. However, a deep knowledge of its underlying architecture is needed in order to achieve a good performance. This work aims at analyzing the impact of different optimizations in accesses to the GPU memories using the CUDA (Compute Unified Device Architecture) architecture from NVIDIA as a case study.application/pdfporProcessamento paraleloMpiGPGPUParallel computingPerformance analysisCUDAMemoryAnálise da hierarquia de memórias em GPGPUsinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPorto Alegre, BR-RS2010Ciência da Computação: Ênfase em Ciência da Computação: Bachareladograduaçãoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSORIGINAL000757777.pdf000757777.pdfTexto completoapplication/pdf2859925http://www.lume.ufrgs.br/bitstream/10183/26339/1/000757777.pdf7afe4c84ecd5bb00fa75940ed530a8a3MD51TEXT000757777.pdf.txt000757777.pdf.txtExtracted Texttext/plain76752http://www.lume.ufrgs.br/bitstream/10183/26339/2/000757777.pdf.txt19134587999fd6b317c443921b2b6a28MD52THUMBNAIL000757777.pdf.jpg000757777.pdf.jpgGenerated Thumbnailimage/jpeg1024http://www.lume.ufrgs.br/bitstream/10183/26339/3/000757777.pdf.jpged4e02724f49cd8deb7c9680409342cbMD5310183/263392018-10-18 07:37:30.743oai:www.lume.ufrgs.br:10183/26339Repositório de PublicaçõesPUBhttps://lume.ufrgs.br/oai/requestopendoar:2018-10-18T10:37:30Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv	Análise da hierarquia de memórias em GPGPUs
title	Análise da hierarquia de memórias em GPGPUs
spellingShingle	Análise da hierarquia de memórias em GPGPUs Conrad, Danilo Fukuda Processamento paralelo Mpi GPGPU Parallel computing Performance analysis CUDA Memory
title_short	Análise da hierarquia de memórias em GPGPUs
title_full	Análise da hierarquia de memórias em GPGPUs
title_fullStr	Análise da hierarquia de memórias em GPGPUs
title_full_unstemmed	Análise da hierarquia de memórias em GPGPUs
title_sort	Análise da hierarquia de memórias em GPGPUs
author	Conrad, Danilo Fukuda
author_facet	Conrad, Danilo Fukuda
author_role	author
dc.contributor.author.fl_str_mv	Conrad, Danilo Fukuda
dc.contributor.advisor1.fl_str_mv	Navaux, Philippe Olivier Alexandre
contributor_str_mv	Navaux, Philippe Olivier Alexandre
dc.subject.por.fl_str_mv	Processamento paralelo Mpi
topic	Processamento paralelo Mpi GPGPU Parallel computing Performance analysis CUDA Memory
dc.subject.eng.fl_str_mv	GPGPU Parallel computing Performance analysis CUDA Memory
description	O uso de placas gráficas como elementos de co-processamento para obter alto desempenho em aplicações paralelas tem crescido cada vez mais nos últimos tempos. Diversos são os exemplos de aplicações que, fazendo uso dessas arquiteturas, obtiveram speedups de até duas ordens de magnitude. Isto é possível pois as GPUs (Graphics Processing Units) possuem uma arquitetura altamente paralela, especializada em processamento de elementos gráficos, que pode ser feito em grande parte paralelamente. Além disso, o surgimento de linguagens de programação e frameworks que facilitam a programação nessas arquiteturas tem sido outro fator chave em sua popularização. Entretanto, ainda é necessário um aprofundado conhecimento da arquitetura utilizada a fim de dimensionar as aplicações nela executadas. Este trabalho tem como objetivo analisar o impacto de diferentes otimizações no acesso à memória da GPU utilizado como caso de estudo a arquitetura CUDA da empresa NVIDIA.
publishDate	2010
dc.date.accessioned.fl_str_mv	2010-10-14T04:19:19Z
dc.date.issued.fl_str_mv	2010
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/bachelorThesis
format	bachelorThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	http://hdl.handle.net/10183/26339
dc.identifier.nrb.pt_BR.fl_str_mv	000757777
url	http://hdl.handle.net/10183/26339
identifier_str_mv	000757777
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.source.none.fl_str_mv	reponame:Repositório Institucional da UFRGS instname:Universidade Federal do Rio Grande do Sul (UFRGS) instacron:UFRGS
instname_str	Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str	UFRGS
institution	UFRGS
reponame_str	Repositório Institucional da UFRGS
collection	Repositório Institucional da UFRGS
bitstream.url.fl_str_mv	http://www.lume.ufrgs.br/bitstream/10183/26339/1/000757777.pdf http://www.lume.ufrgs.br/bitstream/10183/26339/2/000757777.pdf.txt http://www.lume.ufrgs.br/bitstream/10183/26339/3/000757777.pdf.jpg
bitstream.checksum.fl_str_mv	7afe4c84ecd5bb00fa75940ed530a8a3 19134587999fd6b317c443921b2b6a28 ed4e02724f49cd8deb7c9680409342cb
bitstream.checksumAlgorithm.fl_str_mv	MD5 MD5 MD5
repository.name.fl_str_mv	Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv
_version_	1798486721190428672

Análise da hierarquia de memórias em GPGPUs

Registros relacionados