Paralelização do método Meshless Local Petrov-Galerkin (MLPG) utilizando processadores gráficos (GPU) e CUDA
Autor(a) principal: | |
---|---|
Data de Publicação: | 2014 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFMG |
Texto Completo: | http://hdl.handle.net/1843/RAOA-BEKMG6 |
Resumo: | Neste trabalho desenvolvem-se estratégias de paralelismo para o método computacional sem malha Petrov-Galerkin local (MLPG) a ser executado em uma arquitetura altamente paralela conhecida como unidade de processamento gráfico (GPU). Métodos sem malha vem ganhando cada vez mais destaque dentre os métodos computacionais para se resolver problemas regidos por equações diferenciais parciais. Ao contrário do consagrado método dos elementos finitos (FEM), este não precisa de uma malha para obtenção da matriz global do sistema. O domínio do problema é representado por uma distribuição de nós mais uma descrição da fronteira, que na verdade nada mais é do que nós também distribuídos ao longo das bordas do problema, além das condições de contorno. Com a intenção de se obter melhor desempenho do algoritmo, neste trabalho aplica-se o mesmo em uma arquitetura altamente paralela. Diversas aplicações vem sendo desenvolvidas para tal arquitetura, em especial pode-se destacar o modelo de programação CUDA, do inglês computer unified architecture. Esta arquitetura tem mostrado uma imensa versatilidade de forma que é possível delegar computações numéricas utilizando a GPU como um coprocessador auxiliando a unidade central de processamento (CPU). Ométodo sem malha MLPG é paralelizado de forma a ganhar tempo e precisão já que é possível aumentar o n´umero de nós no domínio até um limite bem maior que se fosse executado na CPU. Para testar o algoritmo paralelizado, ele é aplicado a um problema eletromagnéticoclássico que possui solução analítica, e o tempo de execução na GPU é comparado com o tempo obtido pelo mesmo algoritmo executado na CPU. Os resultados obtidos com a GPU GeForce GTX 680 da NVIDIA mostram que é possível se obter um tempo de execução até 20vezes menor com o algoritmo paralelo, mantendo-se a mesma precisão da solução. |
id |
UFMG_6154a6f433bdfb180850624100c9b139 |
---|---|
oai_identifier_str |
oai:repositorio.ufmg.br:1843/RAOA-BEKMG6 |
network_acronym_str |
UFMG |
network_name_str |
Repositório Institucional da UFMG |
repository_id_str |
|
spelling |
Renato Cardoso MesquitaElson Jose da SilvaRicardo Luiz da Silva AdrianoRodney Rezende SaldanhaBruno Carvalho Correa2019-08-14T19:10:58Z2019-08-14T19:10:58Z2014-02-24http://hdl.handle.net/1843/RAOA-BEKMG6Neste trabalho desenvolvem-se estratégias de paralelismo para o método computacional sem malha Petrov-Galerkin local (MLPG) a ser executado em uma arquitetura altamente paralela conhecida como unidade de processamento gráfico (GPU). Métodos sem malha vem ganhando cada vez mais destaque dentre os métodos computacionais para se resolver problemas regidos por equações diferenciais parciais. Ao contrário do consagrado método dos elementos finitos (FEM), este não precisa de uma malha para obtenção da matriz global do sistema. O domínio do problema é representado por uma distribuição de nós mais uma descrição da fronteira, que na verdade nada mais é do que nós também distribuídos ao longo das bordas do problema, além das condições de contorno. Com a intenção de se obter melhor desempenho do algoritmo, neste trabalho aplica-se o mesmo em uma arquitetura altamente paralela. Diversas aplicações vem sendo desenvolvidas para tal arquitetura, em especial pode-se destacar o modelo de programação CUDA, do inglês computer unified architecture. Esta arquitetura tem mostrado uma imensa versatilidade de forma que é possível delegar computações numéricas utilizando a GPU como um coprocessador auxiliando a unidade central de processamento (CPU). Ométodo sem malha MLPG é paralelizado de forma a ganhar tempo e precisão já que é possível aumentar o n´umero de nós no domínio até um limite bem maior que se fosse executado na CPU. Para testar o algoritmo paralelizado, ele é aplicado a um problema eletromagnéticoclássico que possui solução analítica, e o tempo de execução na GPU é comparado com o tempo obtido pelo mesmo algoritmo executado na CPU. Os resultados obtidos com a GPU GeForce GTX 680 da NVIDIA mostram que é possível se obter um tempo de execução até 20vezes menor com o algoritmo paralelo, mantendo-se a mesma precisão da solução.In this work, a new strategy to paralelize the Meshless Local Petrov-Galerkin method(MLPG) is developed. It is executed in a high parallel architecture, the well known graphics processing unit (GPU). The meshless methods are extensively applied nowadays to solve several different problems of partial diferential equations. Compared with the traditional finite element methods, the meshless methods are a quite interesting alternative because they do not require a mesh in order to solve a physical problem, only a node distribution and a proper description of the boundary of the problem (that is actually a node distribution on the boundary) as well as the boundary conditions are needed. In this work the algorithm is adapted to run on the GPU. Several applications are being developed to execute in this new architecture to take advantage of its high parallel nature. Among several models of programming, one can distinguish CUDA or Computer Unified Architecture of NVIDIA. CUDA is a scalable parallel architecture developed by NVIDIA and can be programmed in C or via graphics API, so that the GPU can be used as a coprocessor auxilliating the central processing unit (CPU) as well as serving as a cheap supercomputer for numerical applications with surprisingly readiness. The MLPG is parallelized to execute completly on the GPU side. The MLPG was chosen because of its simplicity and because it does not require any complex geometric representation of the domain or any sychronization scheme to obtain the global system of equations. In order to test this approach, it is applied to an electromagnetic problem whose analytical solution exist. The execution time of both GPU and CPU versions are compared. The results obtained with NIVIDA GeForce GTX 680 in this work shows that it is possible to have an execution time 20 times smaller than the counterpart algorithm on the CPU, ensuring the same precision of results.Universidade Federal de Minas GeraisUFMGEngenharia elétricaEngenharia elétricaParalelização do método Meshless Local Petrov-Galerkin (MLPG) utilizando processadores gráficos (GPU) e CUDAinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINALdissertac_a_obruno.pdfapplication/pdf3012612https://repositorio.ufmg.br/bitstream/1843/RAOA-BEKMG6/1/dissertac_a_obruno.pdfd1426e049418f1aeed71fc746e82c41bMD51TEXTdissertac_a_obruno.pdf.txtdissertac_a_obruno.pdf.txtExtracted texttext/plain133604https://repositorio.ufmg.br/bitstream/1843/RAOA-BEKMG6/2/dissertac_a_obruno.pdf.txte92eabb4d8d1860e18b5ffb14c5d0904MD521843/RAOA-BEKMG62019-11-14 03:19:42.06oai:repositorio.ufmg.br:1843/RAOA-BEKMG6Repositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2019-11-14T06:19:42Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false |
dc.title.pt_BR.fl_str_mv |
Paralelização do método Meshless Local Petrov-Galerkin (MLPG) utilizando processadores gráficos (GPU) e CUDA |
title |
Paralelização do método Meshless Local Petrov-Galerkin (MLPG) utilizando processadores gráficos (GPU) e CUDA |
spellingShingle |
Paralelização do método Meshless Local Petrov-Galerkin (MLPG) utilizando processadores gráficos (GPU) e CUDA Bruno Carvalho Correa Engenharia elétrica Engenharia elétrica |
title_short |
Paralelização do método Meshless Local Petrov-Galerkin (MLPG) utilizando processadores gráficos (GPU) e CUDA |
title_full |
Paralelização do método Meshless Local Petrov-Galerkin (MLPG) utilizando processadores gráficos (GPU) e CUDA |
title_fullStr |
Paralelização do método Meshless Local Petrov-Galerkin (MLPG) utilizando processadores gráficos (GPU) e CUDA |
title_full_unstemmed |
Paralelização do método Meshless Local Petrov-Galerkin (MLPG) utilizando processadores gráficos (GPU) e CUDA |
title_sort |
Paralelização do método Meshless Local Petrov-Galerkin (MLPG) utilizando processadores gráficos (GPU) e CUDA |
author |
Bruno Carvalho Correa |
author_facet |
Bruno Carvalho Correa |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Renato Cardoso Mesquita |
dc.contributor.referee1.fl_str_mv |
Elson Jose da Silva |
dc.contributor.referee2.fl_str_mv |
Ricardo Luiz da Silva Adriano |
dc.contributor.referee3.fl_str_mv |
Rodney Rezende Saldanha |
dc.contributor.author.fl_str_mv |
Bruno Carvalho Correa |
contributor_str_mv |
Renato Cardoso Mesquita Elson Jose da Silva Ricardo Luiz da Silva Adriano Rodney Rezende Saldanha |
dc.subject.por.fl_str_mv |
Engenharia elétrica |
topic |
Engenharia elétrica Engenharia elétrica |
dc.subject.other.pt_BR.fl_str_mv |
Engenharia elétrica |
description |
Neste trabalho desenvolvem-se estratégias de paralelismo para o método computacional sem malha Petrov-Galerkin local (MLPG) a ser executado em uma arquitetura altamente paralela conhecida como unidade de processamento gráfico (GPU). Métodos sem malha vem ganhando cada vez mais destaque dentre os métodos computacionais para se resolver problemas regidos por equações diferenciais parciais. Ao contrário do consagrado método dos elementos finitos (FEM), este não precisa de uma malha para obtenção da matriz global do sistema. O domínio do problema é representado por uma distribuição de nós mais uma descrição da fronteira, que na verdade nada mais é do que nós também distribuídos ao longo das bordas do problema, além das condições de contorno. Com a intenção de se obter melhor desempenho do algoritmo, neste trabalho aplica-se o mesmo em uma arquitetura altamente paralela. Diversas aplicações vem sendo desenvolvidas para tal arquitetura, em especial pode-se destacar o modelo de programação CUDA, do inglês computer unified architecture. Esta arquitetura tem mostrado uma imensa versatilidade de forma que é possível delegar computações numéricas utilizando a GPU como um coprocessador auxiliando a unidade central de processamento (CPU). Ométodo sem malha MLPG é paralelizado de forma a ganhar tempo e precisão já que é possível aumentar o n´umero de nós no domínio até um limite bem maior que se fosse executado na CPU. Para testar o algoritmo paralelizado, ele é aplicado a um problema eletromagnéticoclássico que possui solução analítica, e o tempo de execução na GPU é comparado com o tempo obtido pelo mesmo algoritmo executado na CPU. Os resultados obtidos com a GPU GeForce GTX 680 da NVIDIA mostram que é possível se obter um tempo de execução até 20vezes menor com o algoritmo paralelo, mantendo-se a mesma precisão da solução. |
publishDate |
2014 |
dc.date.issued.fl_str_mv |
2014-02-24 |
dc.date.accessioned.fl_str_mv |
2019-08-14T19:10:58Z |
dc.date.available.fl_str_mv |
2019-08-14T19:10:58Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/1843/RAOA-BEKMG6 |
url |
http://hdl.handle.net/1843/RAOA-BEKMG6 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Minas Gerais |
dc.publisher.initials.fl_str_mv |
UFMG |
publisher.none.fl_str_mv |
Universidade Federal de Minas Gerais |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFMG instname:Universidade Federal de Minas Gerais (UFMG) instacron:UFMG |
instname_str |
Universidade Federal de Minas Gerais (UFMG) |
instacron_str |
UFMG |
institution |
UFMG |
reponame_str |
Repositório Institucional da UFMG |
collection |
Repositório Institucional da UFMG |
bitstream.url.fl_str_mv |
https://repositorio.ufmg.br/bitstream/1843/RAOA-BEKMG6/1/dissertac_a_obruno.pdf https://repositorio.ufmg.br/bitstream/1843/RAOA-BEKMG6/2/dissertac_a_obruno.pdf.txt |
bitstream.checksum.fl_str_mv |
d1426e049418f1aeed71fc746e82c41b e92eabb4d8d1860e18b5ffb14c5d0904 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG) |
repository.mail.fl_str_mv |
|
_version_ |
1803589343131992064 |