Ajuste nas dimensões de kernels para dispositivos aceleradores com base na análise de características arquiteturais e na utilização de ferramenta de autotuning

Detalhes bibliográficos
Autor(a) principal: Queiroz Filho, João Martins de
Data de Publicação: 2018
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
Texto Completo: http://repositorio.utfpr.edu.br/jspui/handle/1/6010
Resumo: Atualmente há uma lacuna de desempenho entre Unidade Central de Processamento (CPU) e Unidade de Processamento Gráfico (GPU), esta lacuna fez com que desenvolvedores tenham o interesse por aplicações que exploram o trabalho conjunto entre CPUs e GPUs. Contudo para criar essas aplicações os desenvolvedores encontram desafios, desde transformar código legado para sistemas multicores até encontrar a configuração ideal para a arquitetura do dispositivo alvo. Desta forma, este trabalho tem como objetivo analisar por meio de ferramentas de autotuning de software a escolha de configurações para o arranjo de threads, na tentativa de extrair o melhor desempenho para dispositivos aceleradores, neste caso GPUs. Para alcançar esse objetivo foi utilizado um subconjunto de algoritmos da família Polybech, KernelGen e NVIDIA CUDA Samples que tiveram seus kernels testados com a ferramenta de autotuning OpenTuner. Os benchmarks foram executados e resultados de algumas métricas foram coletados utilizando a ferramenta de perfilamento nvprof da NVIDIA para a escolha da melhor configuração para cada contexto. Os resultados sugerem que o meio mais eficiente para se encontrar a melhor configuração para a arquitetura é utilizando ferramentas de autotuning, pois para determinados tamanhos torna-se inviável a escolha da configuração por meio de busca exaustiva ou por escolhas aleatórias.
id UTFPR-12_58fd3b00bd217f68f194f23a585d7bb3
oai_identifier_str oai:repositorio.utfpr.edu.br:1/6010
network_acronym_str UTFPR-12
network_name_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
repository_id_str
spelling 2020-11-09T19:10:16Z2020-11-09T19:10:16Z2018-06-20QUEIROZ FILHO, João Martins de. Ajuste nas dimensões de kernels para dispositivos aceleradores com base na análise de características arquiteturais e na utilização de ferramenta de autotuning. 2018. 97 f. Trabalho de Conclusão de Curso (Graduação) – Universidade Tecnológica Federal do Paraná, Campo Mourão, 2018.http://repositorio.utfpr.edu.br/jspui/handle/1/6010Atualmente há uma lacuna de desempenho entre Unidade Central de Processamento (CPU) e Unidade de Processamento Gráfico (GPU), esta lacuna fez com que desenvolvedores tenham o interesse por aplicações que exploram o trabalho conjunto entre CPUs e GPUs. Contudo para criar essas aplicações os desenvolvedores encontram desafios, desde transformar código legado para sistemas multicores até encontrar a configuração ideal para a arquitetura do dispositivo alvo. Desta forma, este trabalho tem como objetivo analisar por meio de ferramentas de autotuning de software a escolha de configurações para o arranjo de threads, na tentativa de extrair o melhor desempenho para dispositivos aceleradores, neste caso GPUs. Para alcançar esse objetivo foi utilizado um subconjunto de algoritmos da família Polybech, KernelGen e NVIDIA CUDA Samples que tiveram seus kernels testados com a ferramenta de autotuning OpenTuner. Os benchmarks foram executados e resultados de algumas métricas foram coletados utilizando a ferramenta de perfilamento nvprof da NVIDIA para a escolha da melhor configuração para cada contexto. Os resultados sugerem que o meio mais eficiente para se encontrar a melhor configuração para a arquitetura é utilizando ferramentas de autotuning, pois para determinados tamanhos torna-se inviável a escolha da configuração por meio de busca exaustiva ou por escolhas aleatórias.Currently there is a performance gap between the Central Processing Unit (CPU) and the Graphics Processing Unit (GPU), this gap has made developers have an interest in applications that exploit the joint work between CPUs and GPUs. However, to create such applications developers face challenges ranging from transforming legacy code to multicore systems until they find the optimal configuration for the target device architecture. In this way, this work has as its objective to analyze the choice of configurations for the arrangement of threads. We are using software tools in an attempt to extract the best performance for device accelerators, in this case GPUs. To achieve this goal a set of algorithms of the Polybench, KernelGen and NVIDIA Samples were used which had their kernels tested with the OpenTuner autotuning tool. Benchmarks were executed and the results of some metrics were collected using nvprof NVIDIA’s profiling tool to choose the best configuration for each context. The results suggest that the most efficient way to find the best configuration for the architecture is to use autotuning tools, because for certain sizes it becomes impracticable to choose the configuration through exhaustive search or random choices.porUniversidade Tecnológica Federal do ParanáCampo MouraoCiência da ComputaçãoUTFPRBrasilDepartamento Acadêmico de ComputaçãoCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOProgramação paralela (Computação)Arranjos de lógica programável em campoProcessamento eletrônico de dadosParallel programming (Computer science)Field programmable gate arraysElectronic data processingAjuste nas dimensões de kernels para dispositivos aceleradores com base na análise de características arquiteturais e na utilização de ferramenta de autotuningAdjusting the dimensions of kernels for accelerator devices based on the analysis of architectural features and the use of the autotuning toolinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisCampo MourãoGonçalves, Rogério AparecidoFoleiss, Juliano HenriqueBorsato, Frank HelbertGonçalves, Rogério AparecidoQueiroz Filho, João Martins deinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))instname:Universidade Tecnológica Federal do Paraná (UTFPR)instacron:UTFPRORIGINALdimensoeskernelsdispositivosaceleradores.pdfapplication/pdf5869970http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/6010/1/dimensoeskernelsdispositivosaceleradores.pdf4b29aa456b659b04b81fc011cfe279d6MD51LICENSElicense.txttext/plain1290http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/6010/2/license.txtb9d82215ab23456fa2d8b49c5df1b95bMD52TEXTdimensoeskernelsdispositivosaceleradores.pdf.txtExtracted texttext/plain178520http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/6010/3/dimensoeskernelsdispositivosaceleradores.pdf.txt6d040188cb5fe7f1c2d53d8c14215a2cMD53THUMBNAILdimensoeskernelsdispositivosaceleradores.pdf.jpgGenerated Thumbnailimage/jpeg1393http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/6010/4/dimensoeskernelsdispositivosaceleradores.pdf.jpg81457aeb4ea3649e7b658cf75a456abdMD541/60102020-11-09 17:10:16.162oai:repositorio.utfpr.edu.br:1/6010TmEgcXVhbGlkYWRlIGRlIHRpdHVsYXIgZG9zIGRpcmVpdG9zIGRlIGF1dG9yIGRhIHB1YmxpY2HDp8OjbywgYXV0b3Jpem8gYSBVVEZQUiBhIHZlaWN1bGFyLCAKYXRyYXbDqXMgZG8gUG9ydGFsIGRlIEluZm9ybWHDp8OjbyBlbSBBY2Vzc28gQWJlcnRvIChQSUFBKSBlIGRvcyBDYXTDoWxvZ29zIGRhcyBCaWJsaW90ZWNhcyAKZGVzdGEgSW5zdGl0dWnDp8Ojbywgc2VtIHJlc3NhcmNpbWVudG8gZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCBkZSBhY29yZG8gY29tIGEgTGVpIG5vIDkuNjEwLzk4LCAKbyB0ZXh0byBkZXN0YSBvYnJhLCBvYnNlcnZhbmRvIGFzIGNvbmRpw6fDtWVzIGRlIGRpc3BvbmliaWxpemHDp8OjbyByZWdpc3RyYWRhcyBubyBpdGVtIDQgZG8gCuKAnFRlcm1vIGRlIEF1dG9yaXphw6fDo28gcGFyYSBQdWJsaWNhw6fDo28gZGUgVHJhYmFsaG9zIGRlIENvbmNsdXPDo28gZGUgQ3Vyc28gZGUgR3JhZHVhw6fDo28gZSAKRXNwZWNpYWxpemHDp8OjbywgRGlzc2VydGHDp8O1ZXMgZSBUZXNlcyBubyBQb3J0YWwgZGUgSW5mb3JtYcOnw6NvIGUgbm9zIENhdMOhbG9nb3MgRWxldHLDtG5pY29zIGRvIApTaXN0ZW1hIGRlIEJpYmxpb3RlY2FzIGRhIFVURlBS4oCdLCBwYXJhIGZpbnMgZGUgbGVpdHVyYSwgaW1wcmVzc8OjbyBlL291IGRvd25sb2FkLCB2aXNhbmRvIGEgCmRpdnVsZ2HDp8OjbyBkYSBwcm9kdcOnw6NvIGNpZW50w61maWNhIGJyYXNpbGVpcmEuCgogIEFzIHZpYXMgb3JpZ2luYWlzIGUgYXNzaW5hZGFzIHBlbG8ocykgYXV0b3IoZXMpIGRvIOKAnFRlcm1vIGRlIEF1dG9yaXphw6fDo28gcGFyYSBQdWJsaWNhw6fDo28gZGUgClRyYWJhbGhvcyBkZSBDb25jbHVzw6NvIGRlIEN1cnNvIGRlIEdyYWR1YcOnw6NvIGUgRXNwZWNpYWxpemHDp8OjbywgRGlzc2VydGHDp8O1ZXMgZSBUZXNlcyBubyBQb3J0YWwgCmRlIEluZm9ybWHDp8OjbyBlIG5vcyBDYXTDoWxvZ29zIEVsZXRyw7RuaWNvcyBkbyBTaXN0ZW1hIGRlIEJpYmxpb3RlY2FzIGRhIFVURlBS4oCdIGUgZGEg4oCcRGVjbGFyYcOnw6NvIApkZSBBdXRvcmlh4oCdIGVuY29udHJhbS1zZSBhcnF1aXZhZGFzIG5hIEJpYmxpb3RlY2EgZG8gQ8OibXB1cyBubyBxdWFsIG8gdHJhYmFsaG8gZm9pIGRlZmVuZGlkby4gCk5vIGNhc28gZGUgcHVibGljYcOnw7VlcyBkZSBhdXRvcmlhIGNvbGV0aXZhIGUgbXVsdGljw6JtcHVzLCBvcyBkb2N1bWVudG9zIGZpY2Fyw6NvIHNvYiBndWFyZGEgZGEgCkJpYmxpb3RlY2EgY29tIGEgcXVhbCBvIOKAnHByaW1laXJvIGF1dG9y4oCdIHBvc3N1YSB2w61uY3Vsby4KRepositório de PublicaçõesPUBhttp://repositorio.utfpr.edu.br:8080/oai/requestopendoar:2020-11-09T19:10:16Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)false
dc.title.pt_BR.fl_str_mv Ajuste nas dimensões de kernels para dispositivos aceleradores com base na análise de características arquiteturais e na utilização de ferramenta de autotuning
dc.title.alternative.pt_BR.fl_str_mv Adjusting the dimensions of kernels for accelerator devices based on the analysis of architectural features and the use of the autotuning tool
title Ajuste nas dimensões de kernels para dispositivos aceleradores com base na análise de características arquiteturais e na utilização de ferramenta de autotuning
spellingShingle Ajuste nas dimensões de kernels para dispositivos aceleradores com base na análise de características arquiteturais e na utilização de ferramenta de autotuning
Queiroz Filho, João Martins de
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Programação paralela (Computação)
Arranjos de lógica programável em campo
Processamento eletrônico de dados
Parallel programming (Computer science)
Field programmable gate arrays
Electronic data processing
title_short Ajuste nas dimensões de kernels para dispositivos aceleradores com base na análise de características arquiteturais e na utilização de ferramenta de autotuning
title_full Ajuste nas dimensões de kernels para dispositivos aceleradores com base na análise de características arquiteturais e na utilização de ferramenta de autotuning
title_fullStr Ajuste nas dimensões de kernels para dispositivos aceleradores com base na análise de características arquiteturais e na utilização de ferramenta de autotuning
title_full_unstemmed Ajuste nas dimensões de kernels para dispositivos aceleradores com base na análise de características arquiteturais e na utilização de ferramenta de autotuning
title_sort Ajuste nas dimensões de kernels para dispositivos aceleradores com base na análise de características arquiteturais e na utilização de ferramenta de autotuning
author Queiroz Filho, João Martins de
author_facet Queiroz Filho, João Martins de
author_role author
dc.contributor.advisor1.fl_str_mv Gonçalves, Rogério Aparecido
dc.contributor.referee1.fl_str_mv Foleiss, Juliano Henrique
dc.contributor.referee2.fl_str_mv Borsato, Frank Helbert
dc.contributor.referee3.fl_str_mv Gonçalves, Rogério Aparecido
dc.contributor.author.fl_str_mv Queiroz Filho, João Martins de
contributor_str_mv Gonçalves, Rogério Aparecido
Foleiss, Juliano Henrique
Borsato, Frank Helbert
Gonçalves, Rogério Aparecido
dc.subject.cnpq.fl_str_mv CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
topic CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Programação paralela (Computação)
Arranjos de lógica programável em campo
Processamento eletrônico de dados
Parallel programming (Computer science)
Field programmable gate arrays
Electronic data processing
dc.subject.por.fl_str_mv Programação paralela (Computação)
Arranjos de lógica programável em campo
Processamento eletrônico de dados
Parallel programming (Computer science)
Field programmable gate arrays
Electronic data processing
description Atualmente há uma lacuna de desempenho entre Unidade Central de Processamento (CPU) e Unidade de Processamento Gráfico (GPU), esta lacuna fez com que desenvolvedores tenham o interesse por aplicações que exploram o trabalho conjunto entre CPUs e GPUs. Contudo para criar essas aplicações os desenvolvedores encontram desafios, desde transformar código legado para sistemas multicores até encontrar a configuração ideal para a arquitetura do dispositivo alvo. Desta forma, este trabalho tem como objetivo analisar por meio de ferramentas de autotuning de software a escolha de configurações para o arranjo de threads, na tentativa de extrair o melhor desempenho para dispositivos aceleradores, neste caso GPUs. Para alcançar esse objetivo foi utilizado um subconjunto de algoritmos da família Polybech, KernelGen e NVIDIA CUDA Samples que tiveram seus kernels testados com a ferramenta de autotuning OpenTuner. Os benchmarks foram executados e resultados de algumas métricas foram coletados utilizando a ferramenta de perfilamento nvprof da NVIDIA para a escolha da melhor configuração para cada contexto. Os resultados sugerem que o meio mais eficiente para se encontrar a melhor configuração para a arquitetura é utilizando ferramentas de autotuning, pois para determinados tamanhos torna-se inviável a escolha da configuração por meio de busca exaustiva ou por escolhas aleatórias.
publishDate 2018
dc.date.issued.fl_str_mv 2018-06-20
dc.date.accessioned.fl_str_mv 2020-11-09T19:10:16Z
dc.date.available.fl_str_mv 2020-11-09T19:10:16Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv QUEIROZ FILHO, João Martins de. Ajuste nas dimensões de kernels para dispositivos aceleradores com base na análise de características arquiteturais e na utilização de ferramenta de autotuning. 2018. 97 f. Trabalho de Conclusão de Curso (Graduação) – Universidade Tecnológica Federal do Paraná, Campo Mourão, 2018.
dc.identifier.uri.fl_str_mv http://repositorio.utfpr.edu.br/jspui/handle/1/6010
identifier_str_mv QUEIROZ FILHO, João Martins de. Ajuste nas dimensões de kernels para dispositivos aceleradores com base na análise de características arquiteturais e na utilização de ferramenta de autotuning. 2018. 97 f. Trabalho de Conclusão de Curso (Graduação) – Universidade Tecnológica Federal do Paraná, Campo Mourão, 2018.
url http://repositorio.utfpr.edu.br/jspui/handle/1/6010
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Campo Mourao
dc.publisher.program.fl_str_mv Ciência da Computação
dc.publisher.initials.fl_str_mv UTFPR
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Departamento Acadêmico de Computação
publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Campo Mourao
dc.source.none.fl_str_mv reponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
instname:Universidade Tecnológica Federal do Paraná (UTFPR)
instacron:UTFPR
instname_str Universidade Tecnológica Federal do Paraná (UTFPR)
instacron_str UTFPR
institution UTFPR
reponame_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
collection Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
bitstream.url.fl_str_mv http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/6010/1/dimensoeskernelsdispositivosaceleradores.pdf
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/6010/2/license.txt
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/6010/3/dimensoeskernelsdispositivosaceleradores.pdf.txt
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/6010/4/dimensoeskernelsdispositivosaceleradores.pdf.jpg
bitstream.checksum.fl_str_mv 4b29aa456b659b04b81fc011cfe279d6
b9d82215ab23456fa2d8b49c5df1b95b
6d040188cb5fe7f1c2d53d8c14215a2c
81457aeb4ea3649e7b658cf75a456abd
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)
repository.mail.fl_str_mv
_version_ 1805923039667290112