Solução de sistemas lineares de grande porte e computação de alto desempenho
Autor(a) principal: | |
---|---|
Data de Publicação: | 2024 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFBA |
Texto Completo: | https://repositorio.ufba.br/handle/ri/39304 |
Resumo: | Este trabalho descreve um método de solução de sistemas lineares densos de grande porte, positivo definido e bloco-estruturado, com múltiplos lados direitos, que utiliza computação paralela de alto desempenho. A solução do sistema é obtida através da recursão de Levinson generalizada que utiliza a combinação linear de soluções menores, direta e reversa, associadas aos subsistemas de menor ordem. A nova implementação é descrita para computação paralela e baseada em um algoritmo de matriz particionada. O algoritmo foi separado em duas sub-rotinas, a primeira que calcula a solução reversa e a matriz da energia dos erros para as ordens menores, e a segunda que calcula a solução recursivamente. O algoritmo foi implementado para três tipos de sistemas: sistemas de memória compartilhada, memória distribuída e para sistemas com GPU. Em cada caso os sistemas de menor ordem foram calculados usando bibliotecas apropriadas. No primeiro, foi utilizada a biblioteca OpenBLAS ou MKL, no segundo SCALAPACK e finalmente para sistemas com GPU implementamos um algoritmo OUT-OF-CORE, no qual os sistemas de menor ordem foram calculados utilizando MAGMA. Nos três casos, a solução final é comparada com a solução completa do sistema utilizando LAPACK, SCALAPACK e MAGMA, respectivamente. Nos três casos, a primeira parte do algoritmo mostrou-se mais dispendiosa computacionalmente, comparada à decomposição de Cholesky. Porém a segunda parte que calcula a solução, mostrou-se mais eficiente que a solução sucessiva de dois sistemas triangulares, quando o lado direito do sistema possui um tamanho significativo, geralmente algumas vezes o valor de N. O erro no modelo estimado não apresenta variações significativas comparado com a solução de referência. Finalmente, apresentamos a utilização do algoritmo na modelagem de ondas sísmicas no domínio da frequência, que envolve a solução de grandes sistemas lineares esparsos. Estes resultados mostram uma desvantagem do algoritmo em sistemas esparsos não Toeplitz, já que aumenta o custo computacional e o consumo de memória. |
id |
UFBA-2_b3fcc8894bcb800b0bb6108d40c59a51 |
---|---|
oai_identifier_str |
oai:repositorio.ufba.br:ri/39304 |
network_acronym_str |
UFBA-2 |
network_name_str |
Repositório Institucional da UFBA |
repository_id_str |
1932 |
spelling |
2024-04-24T19:09:50Z2024-04-242024-04-24T19:09:50Z2024-01-15ARIZA ARIZA, Cristian David. Solução de sistemas lineares de grande porte e computação de alto desempenho. 2024. 164 f. Tese (Doutorado em Geofísica) Instituto de Geociências, Universidade Federal da Bahia, Salvador, Ba, 2024.https://repositorio.ufba.br/handle/ri/39304Este trabalho descreve um método de solução de sistemas lineares densos de grande porte, positivo definido e bloco-estruturado, com múltiplos lados direitos, que utiliza computação paralela de alto desempenho. A solução do sistema é obtida através da recursão de Levinson generalizada que utiliza a combinação linear de soluções menores, direta e reversa, associadas aos subsistemas de menor ordem. A nova implementação é descrita para computação paralela e baseada em um algoritmo de matriz particionada. O algoritmo foi separado em duas sub-rotinas, a primeira que calcula a solução reversa e a matriz da energia dos erros para as ordens menores, e a segunda que calcula a solução recursivamente. O algoritmo foi implementado para três tipos de sistemas: sistemas de memória compartilhada, memória distribuída e para sistemas com GPU. Em cada caso os sistemas de menor ordem foram calculados usando bibliotecas apropriadas. No primeiro, foi utilizada a biblioteca OpenBLAS ou MKL, no segundo SCALAPACK e finalmente para sistemas com GPU implementamos um algoritmo OUT-OF-CORE, no qual os sistemas de menor ordem foram calculados utilizando MAGMA. Nos três casos, a solução final é comparada com a solução completa do sistema utilizando LAPACK, SCALAPACK e MAGMA, respectivamente. Nos três casos, a primeira parte do algoritmo mostrou-se mais dispendiosa computacionalmente, comparada à decomposição de Cholesky. Porém a segunda parte que calcula a solução, mostrou-se mais eficiente que a solução sucessiva de dois sistemas triangulares, quando o lado direito do sistema possui um tamanho significativo, geralmente algumas vezes o valor de N. O erro no modelo estimado não apresenta variações significativas comparado com a solução de referência. Finalmente, apresentamos a utilização do algoritmo na modelagem de ondas sísmicas no domínio da frequência, que envolve a solução de grandes sistemas lineares esparsos. Estes resultados mostram uma desvantagem do algoritmo em sistemas esparsos não Toeplitz, já que aumenta o custo computacional e o consumo de memória.This work describes a method for solving large, positive-defined, block-structured, dense linear systems with multiple right-hand sides that uses high-performance parallel computing. The system solution is obtained through a generalized Levinson recursion that uses the linear combination of smaller forward and backward solutions associated with lower order subsystems. The new implementation is described for parallel computing and is based on a partitioned matrix algorithm. The algorithm was separated into two subroutines, the first that computes the backward solution and the error energy matrix for smaller orders, and the second that computes the solution recursively. The algorithm was implemented for three types of systems: shared memory systems, distributed memory systems, and GPU systems. In each case, the lowest order systems were calculated using appropriate libraries. In the first, the OpenBLAS or MKL library was used; in the second, SCALAPACK; and finally, for systems with GPUs, we implemented an OUT-OF-CORE algorithm, in which the lowest order systems were calculated using MAGMA. In all three cases, the final solution is compared with the complete system solution using LAPACK, SCALAPACK, and MAGMA, respectively. In all three cases, the first part of the algorithm proved to be more computationally expensive compared to the Cholesky decomposition. However, the second part that computes the solution proved to be more efficient than the successive solution of two triangular systems when the right side of the system has a significant size, generally a few times the value of N. The error in the estimated model does not present significant variations compared to the reference solution. Finally, we present the use of the algorithm in frequency-domain seismic wave modeling, which involves the solution of large, sparse linear systems. These results show a disadvantage of the algorithm in sparse non-Toeplitz systems, as it increases the computational cost and memory consumption.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)porUniversidade Federal da BahiaPós-Graduação em Geofísica (PGEOF) UFBABrasilInstituto de GeociênciasLinear systemComputingModelingHigh performance computingParallel processing (Computers)CNPQ::CIENCIAS EXATAS E DA TERRACNPQ::CIENCIAS EXATAS E DA TERRA::GEOCIENCIASCNPQ::CIENCIAS EXATAS E DA TERRA::GEOCIENCIAS::GEOFISICACNPQ::CIENCIAS EXATAS E DA TERRA::GEOCIENCIAS::GEOFISICA::GEOFISICA APLICADASistemas linearesComputaçãoModelagemComputação de alto desempenhoProcessamento paralelo (Computadores)Solução de sistemas lineares de grande porte e computação de alto desempenhoSolution for large linear systems and high performance computingDoutoradoinfo:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/publishedVersionPorsani, Milton José0000-0003-4668-8579http://lattes.cnpq.br/1428637808064409Porsani, Milton José0000-0003-4668-8579http://lattes.cnpq.br/1428637808064409Bassrei, Amin0000-0002-4653-2016http://lattes.cnpq.br/0254085595142341Santos, Peterson Nogueira0000-0002-7728-7463http://lattes.cnpq.br/0893868643154618Oliveira, Saulo Pomponet0000-0001-8227-8230http://lattes.cnpq.br/3048153332110327Oliveira, Sérgio Adriano Moura0000-0002-2988-8272http://lattes.cnpq.br/8240686670167148http://lattes.cnpq.br/7464905313739223Ariza Ariza, Cristian Davidinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFBAinstname:Universidade Federal da Bahia (UFBA)instacron:UFBAORIGINALCristian David Ariza Ariza_Tese doutorado.pdfCristian David Ariza Ariza_Tese doutorado.pdfTese doutoradoapplication/pdf3556560https://repositorio.ufba.br/bitstream/ri/39304/1/Cristian%20David%20Ariza%20Ariza_Tese%20doutorado.pdfd89fa057bd605231a35076f1af5a32a7MD51open accessLICENSElicense.txtlicense.txttext/plain1720https://repositorio.ufba.br/bitstream/ri/39304/2/license.txtd9b7566281c22d808dbf8f29ff0425c8MD52open accessri/393042024-04-24 16:09:50.502open accessoai:repositorio.ufba.br:ri/39304TElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEKCkNvbSBhIGFwcmVzZW50YcOnw6NvIGRlc3RhIGxpY2Vuw6dhLCBvIGF1dG9yIG91IHRpdHVsYXIgZG9zIGRpcmVpdG9zIGRlIGF1dG9yIGNvbmNlZGUgYW8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgbyBkaXJlaXRvIG7Do28tZXhjbHVzaXZvIGRlIHJlcHJvZHV6aXIsIHRyYWR1emlyIChjb25mb3JtZSBkZWZpbmlkbyBhYmFpeG8pIGUvb3UgZGlzdHJpYnVpciBhIHN1YSBwdWJsaWNhw6fDo28gKGluY2x1aW5kbyBvIHJlc3Vtbykgbm8gZm9ybWF0byBpbXByZXNzbyBlL291IGVsZXRyw7RuaWNvIGUgZW0gcXVhbHF1ZXIgbWVpbywgaW5jbHVpbmRvIG9zIGZvcm1hdG9zIMOhdWRpbyBlL291IHbDrWRlby4KCk8gYXV0b3Igb3UgdGl0dWxhciBkb3MgZGlyZWl0b3MgZGUgYXV0b3IgY29uY29yZGEgcXVlIG8gUmVwb3NpdMOzcmlvIHBvZGUsIHNlbSBhbHRlcmFyIG8gY29udGXDumRvLCB0cmFuc3BvciBhIHN1YSBwdWJsaWNhw6fDo28gcGFyYSBxdWFscXVlciBtZWlvIGUvb3UgZm9ybWF0byBwYXJhIGZpbnMgZGUgcHJlc2VydmHDp8OjbywgcG9kZW5kbyBtYW50ZXIgbWFpcyBkZSB1bWEgY8OzcGlhIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrdXAgZSBwcmVzZXJ2YcOnw6NvLiAKCk8gYXV0b3Igb3UgdGl0dWxhciBkb3MgZGlyZWl0b3MgZGUgYXV0b3IgZGVjbGFyYSBxdWUgYSBzdWEgcHVibGljYcOnw6NvIMOpIG9yaWdpbmFsIGUgcXVlIG7Do28sIHF1ZSBzZWphIGRlIHNldSBjb25oZWNpbWVudG8sIGluZnJpbmdlIGRpcmVpdG9zIGF1dG9yYWlzIGRlIG5pbmd1w6ltLgoKQ2FzbyBhIHN1YSBwdWJsaWNhw6fDo28gY29udGVuaGEgbWF0ZXJpYWwgcXVlIG7Do28gcG9zc3VpIGEgdGl0dWxhcmlkYWRlIGRvcyBkaXJlaXRvcyBhdXRvcmFpcywgdm9jw6ogZGVjbGFyYSBxdWUgb2J0ZXZlIGEgcGVybWlzc8OjbyBpcnJlc3RyaXRhIGRvIGRldGVudG9yIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBwYXJhIGNvbmNlZGVyIGFvIFJlcG9zaXTDs3JpbyBvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgbmVzdGEgbGljZW7Dp2EgZSBxdWUgZXNzZSBtYXRlcmlhbCBkZSBwcm9wcmllZGFkZSBkZSB0ZXJjZWlyb3MgZXN0w6EgY2xhcmFtZW50ZSBpZGVudGlmaWNhZG8gZSByZWNvbmhlY2lkbyBubyB0ZXh0byBvdSBubyBjb250ZcO6ZG8gZGEgcHVibGljYcOnw6NvIG9yYSBkZXBvc2l0YWRhLgoKQ0FTTyBBIFBVQkxJQ0HDh8ODTyBPUkEgREVQT1NJVEFEQSBSRVNVTFRFIERFIFVNIFBBVFJPQ8ONTklPIE9VIEFQT0lPIERFIFVNQSBBR8OKTkNJQSBERSBGT01FTlRPIE9VIE9VVFJPIE9SR0FOSVNNTywgVk9Dw4ogREVDTEFSQSBRVUUgUkVTUEVJVE9VIFRPRE9TIEUgUVVBSVNRVUVSIERJUkVJVE9TIERFIFJFVklTw4NPLCBDT01PIFRBTULDiU0gQVMgREVNQUlTIE9CUklHQcOHw5VFUyBFWElHSURBUyBQT1IgQ09OVFJBVE8gT1UgQUNPUkRPLgoKTyBSZXBvc2l0w7NyaW8gc2UgY29tcHJvbWV0ZSBhIGlkZW50aWZpY2FyLCBjbGFyYW1lbnRlLCBvIChzKSBzZXUocykgbm9tZSAocykgb3UgbyAocykgbm9tZSAocykgZG8gKHMpIGRldGVudG9yIChlcykgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIGRhIHB1YmxpY2HDp8OjbyBlIG7Do28gZmFyw6EgcXVhbHF1ZXIgYWx0ZXJhw6fDo28sIGFsw6ltIGRhcXVlbGFzIGNvbmNlZGlkYXMgcG9yIGVzdGEgbGljZW7Dp2EuCg==Repositório InstitucionalPUBhttp://192.188.11.11:8080/oai/requestopendoar:19322024-04-24T19:09:50Repositório Institucional da UFBA - Universidade Federal da Bahia (UFBA)false |
dc.title.pt_BR.fl_str_mv |
Solução de sistemas lineares de grande porte e computação de alto desempenho |
dc.title.alternative.pt_BR.fl_str_mv |
Solution for large linear systems and high performance computing |
title |
Solução de sistemas lineares de grande porte e computação de alto desempenho |
spellingShingle |
Solução de sistemas lineares de grande porte e computação de alto desempenho Ariza Ariza, Cristian David CNPQ::CIENCIAS EXATAS E DA TERRA CNPQ::CIENCIAS EXATAS E DA TERRA::GEOCIENCIAS CNPQ::CIENCIAS EXATAS E DA TERRA::GEOCIENCIAS::GEOFISICA CNPQ::CIENCIAS EXATAS E DA TERRA::GEOCIENCIAS::GEOFISICA::GEOFISICA APLICADA Sistemas lineares Computação Modelagem Computação de alto desempenho Processamento paralelo (Computadores) Linear system Computing Modeling High performance computing Parallel processing (Computers) |
title_short |
Solução de sistemas lineares de grande porte e computação de alto desempenho |
title_full |
Solução de sistemas lineares de grande porte e computação de alto desempenho |
title_fullStr |
Solução de sistemas lineares de grande porte e computação de alto desempenho |
title_full_unstemmed |
Solução de sistemas lineares de grande porte e computação de alto desempenho |
title_sort |
Solução de sistemas lineares de grande porte e computação de alto desempenho |
author |
Ariza Ariza, Cristian David |
author_facet |
Ariza Ariza, Cristian David |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Porsani, Milton José |
dc.contributor.advisor1ID.fl_str_mv |
0000-0003-4668-8579 |
dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/1428637808064409 |
dc.contributor.referee1.fl_str_mv |
Porsani, Milton José |
dc.contributor.referee1ID.fl_str_mv |
0000-0003-4668-8579 |
dc.contributor.referee1Lattes.fl_str_mv |
http://lattes.cnpq.br/1428637808064409 |
dc.contributor.referee2.fl_str_mv |
Bassrei, Amin |
dc.contributor.referee2ID.fl_str_mv |
0000-0002-4653-2016 |
dc.contributor.referee2Lattes.fl_str_mv |
http://lattes.cnpq.br/0254085595142341 |
dc.contributor.referee3.fl_str_mv |
Santos, Peterson Nogueira |
dc.contributor.referee3ID.fl_str_mv |
0000-0002-7728-7463 |
dc.contributor.referee3Lattes.fl_str_mv |
http://lattes.cnpq.br/0893868643154618 |
dc.contributor.referee4.fl_str_mv |
Oliveira, Saulo Pomponet |
dc.contributor.referee4ID.fl_str_mv |
0000-0001-8227-8230 |
dc.contributor.referee4Lattes.fl_str_mv |
http://lattes.cnpq.br/3048153332110327 |
dc.contributor.referee5.fl_str_mv |
Oliveira, Sérgio Adriano Moura |
dc.contributor.referee5ID.fl_str_mv |
0000-0002-2988-8272 |
dc.contributor.referee5Lattes.fl_str_mv |
http://lattes.cnpq.br/8240686670167148 |
dc.contributor.authorLattes.fl_str_mv |
http://lattes.cnpq.br/7464905313739223 |
dc.contributor.author.fl_str_mv |
Ariza Ariza, Cristian David |
contributor_str_mv |
Porsani, Milton José Porsani, Milton José Bassrei, Amin Santos, Peterson Nogueira Oliveira, Saulo Pomponet Oliveira, Sérgio Adriano Moura |
dc.subject.cnpq.fl_str_mv |
CNPQ::CIENCIAS EXATAS E DA TERRA CNPQ::CIENCIAS EXATAS E DA TERRA::GEOCIENCIAS CNPQ::CIENCIAS EXATAS E DA TERRA::GEOCIENCIAS::GEOFISICA CNPQ::CIENCIAS EXATAS E DA TERRA::GEOCIENCIAS::GEOFISICA::GEOFISICA APLICADA |
topic |
CNPQ::CIENCIAS EXATAS E DA TERRA CNPQ::CIENCIAS EXATAS E DA TERRA::GEOCIENCIAS CNPQ::CIENCIAS EXATAS E DA TERRA::GEOCIENCIAS::GEOFISICA CNPQ::CIENCIAS EXATAS E DA TERRA::GEOCIENCIAS::GEOFISICA::GEOFISICA APLICADA Sistemas lineares Computação Modelagem Computação de alto desempenho Processamento paralelo (Computadores) Linear system Computing Modeling High performance computing Parallel processing (Computers) |
dc.subject.por.fl_str_mv |
Sistemas lineares Computação Modelagem Computação de alto desempenho Processamento paralelo (Computadores) |
dc.subject.other.pt_BR.fl_str_mv |
Linear system Computing Modeling High performance computing Parallel processing (Computers) |
description |
Este trabalho descreve um método de solução de sistemas lineares densos de grande porte, positivo definido e bloco-estruturado, com múltiplos lados direitos, que utiliza computação paralela de alto desempenho. A solução do sistema é obtida através da recursão de Levinson generalizada que utiliza a combinação linear de soluções menores, direta e reversa, associadas aos subsistemas de menor ordem. A nova implementação é descrita para computação paralela e baseada em um algoritmo de matriz particionada. O algoritmo foi separado em duas sub-rotinas, a primeira que calcula a solução reversa e a matriz da energia dos erros para as ordens menores, e a segunda que calcula a solução recursivamente. O algoritmo foi implementado para três tipos de sistemas: sistemas de memória compartilhada, memória distribuída e para sistemas com GPU. Em cada caso os sistemas de menor ordem foram calculados usando bibliotecas apropriadas. No primeiro, foi utilizada a biblioteca OpenBLAS ou MKL, no segundo SCALAPACK e finalmente para sistemas com GPU implementamos um algoritmo OUT-OF-CORE, no qual os sistemas de menor ordem foram calculados utilizando MAGMA. Nos três casos, a solução final é comparada com a solução completa do sistema utilizando LAPACK, SCALAPACK e MAGMA, respectivamente. Nos três casos, a primeira parte do algoritmo mostrou-se mais dispendiosa computacionalmente, comparada à decomposição de Cholesky. Porém a segunda parte que calcula a solução, mostrou-se mais eficiente que a solução sucessiva de dois sistemas triangulares, quando o lado direito do sistema possui um tamanho significativo, geralmente algumas vezes o valor de N. O erro no modelo estimado não apresenta variações significativas comparado com a solução de referência. Finalmente, apresentamos a utilização do algoritmo na modelagem de ondas sísmicas no domínio da frequência, que envolve a solução de grandes sistemas lineares esparsos. Estes resultados mostram uma desvantagem do algoritmo em sistemas esparsos não Toeplitz, já que aumenta o custo computacional e o consumo de memória. |
publishDate |
2024 |
dc.date.accessioned.fl_str_mv |
2024-04-24T19:09:50Z |
dc.date.available.fl_str_mv |
2024-04-24 2024-04-24T19:09:50Z |
dc.date.issued.fl_str_mv |
2024-01-15 |
dc.type.driver.fl_str_mv |
Doutorado info:eu-repo/semantics/doctoralThesis |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
ARIZA ARIZA, Cristian David. Solução de sistemas lineares de grande porte e computação de alto desempenho. 2024. 164 f. Tese (Doutorado em Geofísica) Instituto de Geociências, Universidade Federal da Bahia, Salvador, Ba, 2024. |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufba.br/handle/ri/39304 |
identifier_str_mv |
ARIZA ARIZA, Cristian David. Solução de sistemas lineares de grande porte e computação de alto desempenho. 2024. 164 f. Tese (Doutorado em Geofísica) Instituto de Geociências, Universidade Federal da Bahia, Salvador, Ba, 2024. |
url |
https://repositorio.ufba.br/handle/ri/39304 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal da Bahia |
dc.publisher.program.fl_str_mv |
Pós-Graduação em Geofísica (PGEOF) |
dc.publisher.initials.fl_str_mv |
UFBA |
dc.publisher.country.fl_str_mv |
Brasil |
dc.publisher.department.fl_str_mv |
Instituto de Geociências |
publisher.none.fl_str_mv |
Universidade Federal da Bahia |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFBA instname:Universidade Federal da Bahia (UFBA) instacron:UFBA |
instname_str |
Universidade Federal da Bahia (UFBA) |
instacron_str |
UFBA |
institution |
UFBA |
reponame_str |
Repositório Institucional da UFBA |
collection |
Repositório Institucional da UFBA |
bitstream.url.fl_str_mv |
https://repositorio.ufba.br/bitstream/ri/39304/1/Cristian%20David%20Ariza%20Ariza_Tese%20doutorado.pdf https://repositorio.ufba.br/bitstream/ri/39304/2/license.txt |
bitstream.checksum.fl_str_mv |
d89fa057bd605231a35076f1af5a32a7 d9b7566281c22d808dbf8f29ff0425c8 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFBA - Universidade Federal da Bahia (UFBA) |
repository.mail.fl_str_mv |
|
_version_ |
1808459365783437312 |