Paralelização do método Meshless Local Petrov-Galerkin (MLPG) utilizando processadores gráficos (GPU) e CUDA

Detalhes bibliográficos
Autor(a) principal: Bruno Carvalho Correa
Data de Publicação: 2014
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFMG
Texto Completo: http://hdl.handle.net/1843/RAOA-BEKMG6
Resumo: Neste trabalho desenvolvem-se estratégias de paralelismo para o método computacional sem malha Petrov-Galerkin local (MLPG) a ser executado em uma arquitetura altamente paralela conhecida como unidade de processamento gráfico (GPU). Métodos sem malha vem ganhando cada vez mais destaque dentre os métodos computacionais para se resolver problemas regidos por equações diferenciais parciais. Ao contrário do consagrado método dos elementos finitos (FEM), este não precisa de uma malha para obtenção da matriz global do sistema. O domínio do problema é representado por uma distribuição de nós mais uma descrição da fronteira, que na verdade nada mais é do que nós também distribuídos ao longo das bordas do problema, além das condições de contorno. Com a intenção de se obter melhor desempenho do algoritmo, neste trabalho aplica-se o mesmo em uma arquitetura altamente paralela. Diversas aplicações vem sendo desenvolvidas para tal arquitetura, em especial pode-se destacar o modelo de programação CUDA, do inglês computer unified architecture. Esta arquitetura tem mostrado uma imensa versatilidade de forma que é possível delegar computações numéricas utilizando a GPU como um coprocessador auxiliando a unidade central de processamento (CPU). Ométodo sem malha MLPG é paralelizado de forma a ganhar tempo e precisão já que é possível aumentar o n´umero de nós no domínio até um limite bem maior que se fosse executado na CPU. Para testar o algoritmo paralelizado, ele é aplicado a um problema eletromagnéticoclássico que possui solução analítica, e o tempo de execução na GPU é comparado com o tempo obtido pelo mesmo algoritmo executado na CPU. Os resultados obtidos com a GPU GeForce GTX 680 da NVIDIA mostram que é possível se obter um tempo de execução até 20vezes menor com o algoritmo paralelo, mantendo-se a mesma precisão da solução.
id UFMG_6154a6f433bdfb180850624100c9b139
oai_identifier_str oai:repositorio.ufmg.br:1843/RAOA-BEKMG6
network_acronym_str UFMG
network_name_str Repositório Institucional da UFMG
repository_id_str
spelling Renato Cardoso MesquitaElson Jose da SilvaRicardo Luiz da Silva AdrianoRodney Rezende SaldanhaBruno Carvalho Correa2019-08-14T19:10:58Z2019-08-14T19:10:58Z2014-02-24http://hdl.handle.net/1843/RAOA-BEKMG6Neste trabalho desenvolvem-se estratégias de paralelismo para o método computacional sem malha Petrov-Galerkin local (MLPG) a ser executado em uma arquitetura altamente paralela conhecida como unidade de processamento gráfico (GPU). Métodos sem malha vem ganhando cada vez mais destaque dentre os métodos computacionais para se resolver problemas regidos por equações diferenciais parciais. Ao contrário do consagrado método dos elementos finitos (FEM), este não precisa de uma malha para obtenção da matriz global do sistema. O domínio do problema é representado por uma distribuição de nós mais uma descrição da fronteira, que na verdade nada mais é do que nós também distribuídos ao longo das bordas do problema, além das condições de contorno. Com a intenção de se obter melhor desempenho do algoritmo, neste trabalho aplica-se o mesmo em uma arquitetura altamente paralela. Diversas aplicações vem sendo desenvolvidas para tal arquitetura, em especial pode-se destacar o modelo de programação CUDA, do inglês computer unified architecture. Esta arquitetura tem mostrado uma imensa versatilidade de forma que é possível delegar computações numéricas utilizando a GPU como um coprocessador auxiliando a unidade central de processamento (CPU). Ométodo sem malha MLPG é paralelizado de forma a ganhar tempo e precisão já que é possível aumentar o n´umero de nós no domínio até um limite bem maior que se fosse executado na CPU. Para testar o algoritmo paralelizado, ele é aplicado a um problema eletromagnéticoclássico que possui solução analítica, e o tempo de execução na GPU é comparado com o tempo obtido pelo mesmo algoritmo executado na CPU. Os resultados obtidos com a GPU GeForce GTX 680 da NVIDIA mostram que é possível se obter um tempo de execução até 20vezes menor com o algoritmo paralelo, mantendo-se a mesma precisão da solução.In this work, a new strategy to paralelize the Meshless Local Petrov-Galerkin method(MLPG) is developed. It is executed in a high parallel architecture, the well known graphics processing unit (GPU). The meshless methods are extensively applied nowadays to solve several different problems of partial diferential equations. Compared with the traditional finite element methods, the meshless methods are a quite interesting alternative because they do not require a mesh in order to solve a physical problem, only a node distribution and a proper description of the boundary of the problem (that is actually a node distribution on the boundary) as well as the boundary conditions are needed. In this work the algorithm is adapted to run on the GPU. Several applications are being developed to execute in this new architecture to take advantage of its high parallel nature. Among several models of programming, one can distinguish CUDA or Computer Unified Architecture of NVIDIA. CUDA is a scalable parallel architecture developed by NVIDIA and can be programmed in C or via graphics API, so that the GPU can be used as a coprocessor auxilliating the central processing unit (CPU) as well as serving as a cheap supercomputer for numerical applications with surprisingly readiness. The MLPG is parallelized to execute completly on the GPU side. The MLPG was chosen because of its simplicity and because it does not require any complex geometric representation of the domain or any sychronization scheme to obtain the global system of equations. In order to test this approach, it is applied to an electromagnetic problem whose analytical solution exist. The execution time of both GPU and CPU versions are compared. The results obtained with NIVIDA GeForce GTX 680 in this work shows that it is possible to have an execution time 20 times smaller than the counterpart algorithm on the CPU, ensuring the same precision of results.Universidade Federal de Minas GeraisUFMGEngenharia elétricaEngenharia elétricaParalelização do método Meshless Local Petrov-Galerkin (MLPG) utilizando processadores gráficos (GPU) e CUDAinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINALdissertac_a_obruno.pdfapplication/pdf3012612https://repositorio.ufmg.br/bitstream/1843/RAOA-BEKMG6/1/dissertac_a_obruno.pdfd1426e049418f1aeed71fc746e82c41bMD51TEXTdissertac_a_obruno.pdf.txtdissertac_a_obruno.pdf.txtExtracted texttext/plain133604https://repositorio.ufmg.br/bitstream/1843/RAOA-BEKMG6/2/dissertac_a_obruno.pdf.txte92eabb4d8d1860e18b5ffb14c5d0904MD521843/RAOA-BEKMG62019-11-14 03:19:42.06oai:repositorio.ufmg.br:1843/RAOA-BEKMG6Repositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2019-11-14T06:19:42Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false
dc.title.pt_BR.fl_str_mv Paralelização do método Meshless Local Petrov-Galerkin (MLPG) utilizando processadores gráficos (GPU) e CUDA
title Paralelização do método Meshless Local Petrov-Galerkin (MLPG) utilizando processadores gráficos (GPU) e CUDA
spellingShingle Paralelização do método Meshless Local Petrov-Galerkin (MLPG) utilizando processadores gráficos (GPU) e CUDA
Bruno Carvalho Correa
Engenharia elétrica
Engenharia elétrica
title_short Paralelização do método Meshless Local Petrov-Galerkin (MLPG) utilizando processadores gráficos (GPU) e CUDA
title_full Paralelização do método Meshless Local Petrov-Galerkin (MLPG) utilizando processadores gráficos (GPU) e CUDA
title_fullStr Paralelização do método Meshless Local Petrov-Galerkin (MLPG) utilizando processadores gráficos (GPU) e CUDA
title_full_unstemmed Paralelização do método Meshless Local Petrov-Galerkin (MLPG) utilizando processadores gráficos (GPU) e CUDA
title_sort Paralelização do método Meshless Local Petrov-Galerkin (MLPG) utilizando processadores gráficos (GPU) e CUDA
author Bruno Carvalho Correa
author_facet Bruno Carvalho Correa
author_role author
dc.contributor.advisor1.fl_str_mv Renato Cardoso Mesquita
dc.contributor.referee1.fl_str_mv Elson Jose da Silva
dc.contributor.referee2.fl_str_mv Ricardo Luiz da Silva Adriano
dc.contributor.referee3.fl_str_mv Rodney Rezende Saldanha
dc.contributor.author.fl_str_mv Bruno Carvalho Correa
contributor_str_mv Renato Cardoso Mesquita
Elson Jose da Silva
Ricardo Luiz da Silva Adriano
Rodney Rezende Saldanha
dc.subject.por.fl_str_mv Engenharia elétrica
topic Engenharia elétrica
Engenharia elétrica
dc.subject.other.pt_BR.fl_str_mv Engenharia elétrica
description Neste trabalho desenvolvem-se estratégias de paralelismo para o método computacional sem malha Petrov-Galerkin local (MLPG) a ser executado em uma arquitetura altamente paralela conhecida como unidade de processamento gráfico (GPU). Métodos sem malha vem ganhando cada vez mais destaque dentre os métodos computacionais para se resolver problemas regidos por equações diferenciais parciais. Ao contrário do consagrado método dos elementos finitos (FEM), este não precisa de uma malha para obtenção da matriz global do sistema. O domínio do problema é representado por uma distribuição de nós mais uma descrição da fronteira, que na verdade nada mais é do que nós também distribuídos ao longo das bordas do problema, além das condições de contorno. Com a intenção de se obter melhor desempenho do algoritmo, neste trabalho aplica-se o mesmo em uma arquitetura altamente paralela. Diversas aplicações vem sendo desenvolvidas para tal arquitetura, em especial pode-se destacar o modelo de programação CUDA, do inglês computer unified architecture. Esta arquitetura tem mostrado uma imensa versatilidade de forma que é possível delegar computações numéricas utilizando a GPU como um coprocessador auxiliando a unidade central de processamento (CPU). Ométodo sem malha MLPG é paralelizado de forma a ganhar tempo e precisão já que é possível aumentar o n´umero de nós no domínio até um limite bem maior que se fosse executado na CPU. Para testar o algoritmo paralelizado, ele é aplicado a um problema eletromagnéticoclássico que possui solução analítica, e o tempo de execução na GPU é comparado com o tempo obtido pelo mesmo algoritmo executado na CPU. Os resultados obtidos com a GPU GeForce GTX 680 da NVIDIA mostram que é possível se obter um tempo de execução até 20vezes menor com o algoritmo paralelo, mantendo-se a mesma precisão da solução.
publishDate 2014
dc.date.issued.fl_str_mv 2014-02-24
dc.date.accessioned.fl_str_mv 2019-08-14T19:10:58Z
dc.date.available.fl_str_mv 2019-08-14T19:10:58Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/1843/RAOA-BEKMG6
url http://hdl.handle.net/1843/RAOA-BEKMG6
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.publisher.initials.fl_str_mv UFMG
publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFMG
instname:Universidade Federal de Minas Gerais (UFMG)
instacron:UFMG
instname_str Universidade Federal de Minas Gerais (UFMG)
instacron_str UFMG
institution UFMG
reponame_str Repositório Institucional da UFMG
collection Repositório Institucional da UFMG
bitstream.url.fl_str_mv https://repositorio.ufmg.br/bitstream/1843/RAOA-BEKMG6/1/dissertac_a_obruno.pdf
https://repositorio.ufmg.br/bitstream/1843/RAOA-BEKMG6/2/dissertac_a_obruno.pdf.txt
bitstream.checksum.fl_str_mv d1426e049418f1aeed71fc746e82c41b
e92eabb4d8d1860e18b5ffb14c5d0904
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)
repository.mail.fl_str_mv
_version_ 1803589343131992064