Desenvolvimento de algoritmos para geração de modelos geoestatísticos usando aprendizado de máquina e computação de alta-performance
Autor(a) principal: | |
---|---|
Data de Publicação: | 2022 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da UFRGS |
Texto Completo: | http://hdl.handle.net/10183/249828 |
Resumo: | A evolução na capacidade de processamento dos computadores viabilizou a implementação de algoritmos de simulação geoestatística. Por meio da simulação, é possível criar uma realização de uma função aleatória com as mesmas características estatísticas dos dados amostrais. Como, na prática, é necessária a geração de várias realizações, esse processo pode ser custoso computacionalmente. Principalmente, se a grade-alvo contiver muitas células. Por isso, nesse trabalho, estuda-se os métodos de simulação espectral (Bandas Rotatórias e Método Integral de Fourier) como alternativa ao algoritmo de Simulação Sequencial Gaussiana (SSG). Os métodos de simulação espectral eliminam a necessidade de um caminho aleatório no processo de geração da realização de uma função aleatória. Isso torna esses algoritmos extremamente amigáveis à aplicação de técnicas de paralelização e computação distribuída. Além disso, o esforço computacional necessário é significativamente reduzido. Conforme é mostrado nesse trabalho, a simulação espectral permite ganhos significativos de performance sem prejuízo na qualidade das realizações geradas. Além da utilização dos métodos espectrais como alternativa de alta performance à simulação geoestatística, são estudadas técnicas de otimização matemática para obtenção de modelos de covariância. Baseada na Busca Tabu, é construído um algoritmo para computação automática do modelo de covariância. Também, inspirado em técnicas de validação cruzada, como Jackknife e K-Fold, é construído um algoritmo de simulação chamado Ensemble Simulation. O algoritmo proposto utiliza otimização matemática para encontrar o modelo de covariância mais adequado para uma vizinhança, com uma função objetivo construída a partir do erro de validação. Portanto, por meio da otimização e do Ensemble Simulation é desenvolvido um modo de simular a função aleatória sem explicitamente definir um modelo de covariância. Tendo em vista que a modelagem manual do modelo de covariância é a tarefa mais dispendiosa do fluxo de trabalho da simulação geoestatística, essas técnicas permitem a automatização do processo. Em suma, nesse trabalho, são estudadas técnicas que viabilizam a automatização e melhoria da performance da simulação geoestatística e os resultados demonstram sua utilidade. |
id |
URGS_852adac57d249d220ef40272c4ed7c04 |
---|---|
oai_identifier_str |
oai:www.lume.ufrgs.br:10183/249828 |
network_acronym_str |
URGS |
network_name_str |
Biblioteca Digital de Teses e Dissertações da UFRGS |
repository_id_str |
1853 |
spelling |
Machado, Péricles LopesCosta, Joao Felipe Coimbra Leite2022-10-07T04:51:36Z2022http://hdl.handle.net/10183/249828001149271A evolução na capacidade de processamento dos computadores viabilizou a implementação de algoritmos de simulação geoestatística. Por meio da simulação, é possível criar uma realização de uma função aleatória com as mesmas características estatísticas dos dados amostrais. Como, na prática, é necessária a geração de várias realizações, esse processo pode ser custoso computacionalmente. Principalmente, se a grade-alvo contiver muitas células. Por isso, nesse trabalho, estuda-se os métodos de simulação espectral (Bandas Rotatórias e Método Integral de Fourier) como alternativa ao algoritmo de Simulação Sequencial Gaussiana (SSG). Os métodos de simulação espectral eliminam a necessidade de um caminho aleatório no processo de geração da realização de uma função aleatória. Isso torna esses algoritmos extremamente amigáveis à aplicação de técnicas de paralelização e computação distribuída. Além disso, o esforço computacional necessário é significativamente reduzido. Conforme é mostrado nesse trabalho, a simulação espectral permite ganhos significativos de performance sem prejuízo na qualidade das realizações geradas. Além da utilização dos métodos espectrais como alternativa de alta performance à simulação geoestatística, são estudadas técnicas de otimização matemática para obtenção de modelos de covariância. Baseada na Busca Tabu, é construído um algoritmo para computação automática do modelo de covariância. Também, inspirado em técnicas de validação cruzada, como Jackknife e K-Fold, é construído um algoritmo de simulação chamado Ensemble Simulation. O algoritmo proposto utiliza otimização matemática para encontrar o modelo de covariância mais adequado para uma vizinhança, com uma função objetivo construída a partir do erro de validação. Portanto, por meio da otimização e do Ensemble Simulation é desenvolvido um modo de simular a função aleatória sem explicitamente definir um modelo de covariância. Tendo em vista que a modelagem manual do modelo de covariância é a tarefa mais dispendiosa do fluxo de trabalho da simulação geoestatística, essas técnicas permitem a automatização do processo. Em suma, nesse trabalho, são estudadas técnicas que viabilizam a automatização e melhoria da performance da simulação geoestatística e os resultados demonstram sua utilidade.The evolution in the processing capacity of computers enabled the implementation of geostatistical simulation algorithms. It is possible to create a realization of a random function with the same statistical characteristics as the sample data through simulation. As, in practice, it is necessary to generate several realizations, this process can be computationally expensive. Mainly if the target grid is large. Therefore, in this work, we study the spectral simulation methods (Turning Bands and Fourier Integral Method) as an alternative to the Sequential Gaussian Simulation (SGS). Spectral simulation eliminates the need for a random path in generating the realization of a random function. This simplifies the usage of parallelization and distributed computing techniques. Furthermore, the computational effort required is significantly reduced. Therefore, spectral simulation allows significant performance gains without compromising the quality of the generated realizations. In addition, we studied mathematical optimization techniques for obtaining covariance models. An algorithm based on Tabu Search for automatic computation of the covariance model was developed, and also, inspired by cross-validation methods such as Jackknife and K-Fold, a simulation algorithm called Ensemble Simulation is proposed. The proposed algorithm uses mathematical optimization to find the most suitable covariance model for a neighborhood, with an objective function built from the validation error. Therefore, a workflow is developed through optimization and Ensemble Simulation to simulate the random function without explicitly defining a covariance model. Since manual modeling of the covariance model is the most expensive task of the geostatistical simulation workflow, these techniques provided a way to automate this task. In short, in this work, techniques that enable the automation and improvement of the performance of geostatistical simulation were proposed and the results proved their usefulness.application/pdfporSimulação geoestatísticaOtimização matemáticaAprendizado de máquinaProcessamento de alto desempenhoGeostatistical simulationSpectral methodsMachine learningCross validationOptimizationDesenvolvimento de algoritmos para geração de modelos geoestatísticos usando aprendizado de máquina e computação de alta-performanceinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisUniversidade Federal do Rio Grande do SulEscola de EngenhariaPrograma de Pós-Graduação em Engenharia de Minas, Metalúrgica e de MateriaisPorto Alegre, BR-RS2022doutoradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001149271.pdf.txt001149271.pdf.txtExtracted Texttext/plain282137http://www.lume.ufrgs.br/bitstream/10183/249828/2/001149271.pdf.txt71642b12cf569109637bbe38e2990e07MD52ORIGINAL001149271.pdfTexto completoapplication/pdf9295718http://www.lume.ufrgs.br/bitstream/10183/249828/1/001149271.pdf66cbd0400ba097d757cce69d49ccfe84MD5110183/2498282022-10-08 05:01:22.286478oai:www.lume.ufrgs.br:10183/249828Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532022-10-08T08:01:22Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false |
dc.title.pt_BR.fl_str_mv |
Desenvolvimento de algoritmos para geração de modelos geoestatísticos usando aprendizado de máquina e computação de alta-performance |
title |
Desenvolvimento de algoritmos para geração de modelos geoestatísticos usando aprendizado de máquina e computação de alta-performance |
spellingShingle |
Desenvolvimento de algoritmos para geração de modelos geoestatísticos usando aprendizado de máquina e computação de alta-performance Machado, Péricles Lopes Simulação geoestatística Otimização matemática Aprendizado de máquina Processamento de alto desempenho Geostatistical simulation Spectral methods Machine learning Cross validation Optimization |
title_short |
Desenvolvimento de algoritmos para geração de modelos geoestatísticos usando aprendizado de máquina e computação de alta-performance |
title_full |
Desenvolvimento de algoritmos para geração de modelos geoestatísticos usando aprendizado de máquina e computação de alta-performance |
title_fullStr |
Desenvolvimento de algoritmos para geração de modelos geoestatísticos usando aprendizado de máquina e computação de alta-performance |
title_full_unstemmed |
Desenvolvimento de algoritmos para geração de modelos geoestatísticos usando aprendizado de máquina e computação de alta-performance |
title_sort |
Desenvolvimento de algoritmos para geração de modelos geoestatísticos usando aprendizado de máquina e computação de alta-performance |
author |
Machado, Péricles Lopes |
author_facet |
Machado, Péricles Lopes |
author_role |
author |
dc.contributor.author.fl_str_mv |
Machado, Péricles Lopes |
dc.contributor.advisor1.fl_str_mv |
Costa, Joao Felipe Coimbra Leite |
contributor_str_mv |
Costa, Joao Felipe Coimbra Leite |
dc.subject.por.fl_str_mv |
Simulação geoestatística Otimização matemática Aprendizado de máquina Processamento de alto desempenho |
topic |
Simulação geoestatística Otimização matemática Aprendizado de máquina Processamento de alto desempenho Geostatistical simulation Spectral methods Machine learning Cross validation Optimization |
dc.subject.eng.fl_str_mv |
Geostatistical simulation Spectral methods Machine learning Cross validation Optimization |
description |
A evolução na capacidade de processamento dos computadores viabilizou a implementação de algoritmos de simulação geoestatística. Por meio da simulação, é possível criar uma realização de uma função aleatória com as mesmas características estatísticas dos dados amostrais. Como, na prática, é necessária a geração de várias realizações, esse processo pode ser custoso computacionalmente. Principalmente, se a grade-alvo contiver muitas células. Por isso, nesse trabalho, estuda-se os métodos de simulação espectral (Bandas Rotatórias e Método Integral de Fourier) como alternativa ao algoritmo de Simulação Sequencial Gaussiana (SSG). Os métodos de simulação espectral eliminam a necessidade de um caminho aleatório no processo de geração da realização de uma função aleatória. Isso torna esses algoritmos extremamente amigáveis à aplicação de técnicas de paralelização e computação distribuída. Além disso, o esforço computacional necessário é significativamente reduzido. Conforme é mostrado nesse trabalho, a simulação espectral permite ganhos significativos de performance sem prejuízo na qualidade das realizações geradas. Além da utilização dos métodos espectrais como alternativa de alta performance à simulação geoestatística, são estudadas técnicas de otimização matemática para obtenção de modelos de covariância. Baseada na Busca Tabu, é construído um algoritmo para computação automática do modelo de covariância. Também, inspirado em técnicas de validação cruzada, como Jackknife e K-Fold, é construído um algoritmo de simulação chamado Ensemble Simulation. O algoritmo proposto utiliza otimização matemática para encontrar o modelo de covariância mais adequado para uma vizinhança, com uma função objetivo construída a partir do erro de validação. Portanto, por meio da otimização e do Ensemble Simulation é desenvolvido um modo de simular a função aleatória sem explicitamente definir um modelo de covariância. Tendo em vista que a modelagem manual do modelo de covariância é a tarefa mais dispendiosa do fluxo de trabalho da simulação geoestatística, essas técnicas permitem a automatização do processo. Em suma, nesse trabalho, são estudadas técnicas que viabilizam a automatização e melhoria da performance da simulação geoestatística e os resultados demonstram sua utilidade. |
publishDate |
2022 |
dc.date.accessioned.fl_str_mv |
2022-10-07T04:51:36Z |
dc.date.issued.fl_str_mv |
2022 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10183/249828 |
dc.identifier.nrb.pt_BR.fl_str_mv |
001149271 |
url |
http://hdl.handle.net/10183/249828 |
identifier_str_mv |
001149271 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UFRGS instname:Universidade Federal do Rio Grande do Sul (UFRGS) instacron:UFRGS |
instname_str |
Universidade Federal do Rio Grande do Sul (UFRGS) |
instacron_str |
UFRGS |
institution |
UFRGS |
reponame_str |
Biblioteca Digital de Teses e Dissertações da UFRGS |
collection |
Biblioteca Digital de Teses e Dissertações da UFRGS |
bitstream.url.fl_str_mv |
http://www.lume.ufrgs.br/bitstream/10183/249828/2/001149271.pdf.txt http://www.lume.ufrgs.br/bitstream/10183/249828/1/001149271.pdf |
bitstream.checksum.fl_str_mv |
71642b12cf569109637bbe38e2990e07 66cbd0400ba097d757cce69d49ccfe84 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS) |
repository.mail.fl_str_mv |
lume@ufrgs.br||lume@ufrgs.br |
_version_ |
1810085598762893312 |