Desenvolvimento de algoritmos para geração de modelos geoestatísticos usando aprendizado de máquina e computação de alta-performance

Detalhes bibliográficos
Autor(a) principal: Machado, Péricles Lopes
Data de Publicação: 2022
Tipo de documento: Tese
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da UFRGS
Texto Completo: http://hdl.handle.net/10183/249828
Resumo: A evolução na capacidade de processamento dos computadores viabilizou a implementação de algoritmos de simulação geoestatística. Por meio da simulação, é possível criar uma realização de uma função aleatória com as mesmas características estatísticas dos dados amostrais. Como, na prática, é necessária a geração de várias realizações, esse processo pode ser custoso computacionalmente. Principalmente, se a grade-alvo contiver muitas células. Por isso, nesse trabalho, estuda-se os métodos de simulação espectral (Bandas Rotatórias e Método Integral de Fourier) como alternativa ao algoritmo de Simulação Sequencial Gaussiana (SSG). Os métodos de simulação espectral eliminam a necessidade de um caminho aleatório no processo de geração da realização de uma função aleatória. Isso torna esses algoritmos extremamente amigáveis à aplicação de técnicas de paralelização e computação distribuída. Além disso, o esforço computacional necessário é significativamente reduzido. Conforme é mostrado nesse trabalho, a simulação espectral permite ganhos significativos de performance sem prejuízo na qualidade das realizações geradas. Além da utilização dos métodos espectrais como alternativa de alta performance à simulação geoestatística, são estudadas técnicas de otimização matemática para obtenção de modelos de covariância. Baseada na Busca Tabu, é construído um algoritmo para computação automática do modelo de covariância. Também, inspirado em técnicas de validação cruzada, como Jackknife e K-Fold, é construído um algoritmo de simulação chamado Ensemble Simulation. O algoritmo proposto utiliza otimização matemática para encontrar o modelo de covariância mais adequado para uma vizinhança, com uma função objetivo construída a partir do erro de validação. Portanto, por meio da otimização e do Ensemble Simulation é desenvolvido um modo de simular a função aleatória sem explicitamente definir um modelo de covariância. Tendo em vista que a modelagem manual do modelo de covariância é a tarefa mais dispendiosa do fluxo de trabalho da simulação geoestatística, essas técnicas permitem a automatização do processo. Em suma, nesse trabalho, são estudadas técnicas que viabilizam a automatização e melhoria da performance da simulação geoestatística e os resultados demonstram sua utilidade.
id URGS_852adac57d249d220ef40272c4ed7c04
oai_identifier_str oai:www.lume.ufrgs.br:10183/249828
network_acronym_str URGS
network_name_str Biblioteca Digital de Teses e Dissertações da UFRGS
repository_id_str 1853
spelling Machado, Péricles LopesCosta, Joao Felipe Coimbra Leite2022-10-07T04:51:36Z2022http://hdl.handle.net/10183/249828001149271A evolução na capacidade de processamento dos computadores viabilizou a implementação de algoritmos de simulação geoestatística. Por meio da simulação, é possível criar uma realização de uma função aleatória com as mesmas características estatísticas dos dados amostrais. Como, na prática, é necessária a geração de várias realizações, esse processo pode ser custoso computacionalmente. Principalmente, se a grade-alvo contiver muitas células. Por isso, nesse trabalho, estuda-se os métodos de simulação espectral (Bandas Rotatórias e Método Integral de Fourier) como alternativa ao algoritmo de Simulação Sequencial Gaussiana (SSG). Os métodos de simulação espectral eliminam a necessidade de um caminho aleatório no processo de geração da realização de uma função aleatória. Isso torna esses algoritmos extremamente amigáveis à aplicação de técnicas de paralelização e computação distribuída. Além disso, o esforço computacional necessário é significativamente reduzido. Conforme é mostrado nesse trabalho, a simulação espectral permite ganhos significativos de performance sem prejuízo na qualidade das realizações geradas. Além da utilização dos métodos espectrais como alternativa de alta performance à simulação geoestatística, são estudadas técnicas de otimização matemática para obtenção de modelos de covariância. Baseada na Busca Tabu, é construído um algoritmo para computação automática do modelo de covariância. Também, inspirado em técnicas de validação cruzada, como Jackknife e K-Fold, é construído um algoritmo de simulação chamado Ensemble Simulation. O algoritmo proposto utiliza otimização matemática para encontrar o modelo de covariância mais adequado para uma vizinhança, com uma função objetivo construída a partir do erro de validação. Portanto, por meio da otimização e do Ensemble Simulation é desenvolvido um modo de simular a função aleatória sem explicitamente definir um modelo de covariância. Tendo em vista que a modelagem manual do modelo de covariância é a tarefa mais dispendiosa do fluxo de trabalho da simulação geoestatística, essas técnicas permitem a automatização do processo. Em suma, nesse trabalho, são estudadas técnicas que viabilizam a automatização e melhoria da performance da simulação geoestatística e os resultados demonstram sua utilidade.The evolution in the processing capacity of computers enabled the implementation of geostatistical simulation algorithms. It is possible to create a realization of a random function with the same statistical characteristics as the sample data through simulation. As, in practice, it is necessary to generate several realizations, this process can be computationally expensive. Mainly if the target grid is large. Therefore, in this work, we study the spectral simulation methods (Turning Bands and Fourier Integral Method) as an alternative to the Sequential Gaussian Simulation (SGS). Spectral simulation eliminates the need for a random path in generating the realization of a random function. This simplifies the usage of parallelization and distributed computing techniques. Furthermore, the computational effort required is significantly reduced. Therefore, spectral simulation allows significant performance gains without compromising the quality of the generated realizations. In addition, we studied mathematical optimization techniques for obtaining covariance models. An algorithm based on Tabu Search for automatic computation of the covariance model was developed, and also, inspired by cross-validation methods such as Jackknife and K-Fold, a simulation algorithm called Ensemble Simulation is proposed. The proposed algorithm uses mathematical optimization to find the most suitable covariance model for a neighborhood, with an objective function built from the validation error. Therefore, a workflow is developed through optimization and Ensemble Simulation to simulate the random function without explicitly defining a covariance model. Since manual modeling of the covariance model is the most expensive task of the geostatistical simulation workflow, these techniques provided a way to automate this task. In short, in this work, techniques that enable the automation and improvement of the performance of geostatistical simulation were proposed and the results proved their usefulness.application/pdfporSimulação geoestatísticaOtimização matemáticaAprendizado de máquinaProcessamento de alto desempenhoGeostatistical simulationSpectral methodsMachine learningCross validationOptimizationDesenvolvimento de algoritmos para geração de modelos geoestatísticos usando aprendizado de máquina e computação de alta-performanceinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisUniversidade Federal do Rio Grande do SulEscola de EngenhariaPrograma de Pós-Graduação em Engenharia de Minas, Metalúrgica e de MateriaisPorto Alegre, BR-RS2022doutoradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001149271.pdf.txt001149271.pdf.txtExtracted Texttext/plain282137http://www.lume.ufrgs.br/bitstream/10183/249828/2/001149271.pdf.txt71642b12cf569109637bbe38e2990e07MD52ORIGINAL001149271.pdfTexto completoapplication/pdf9295718http://www.lume.ufrgs.br/bitstream/10183/249828/1/001149271.pdf66cbd0400ba097d757cce69d49ccfe84MD5110183/2498282022-10-08 05:01:22.286478oai:www.lume.ufrgs.br:10183/249828Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532022-10-08T08:01:22Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Desenvolvimento de algoritmos para geração de modelos geoestatísticos usando aprendizado de máquina e computação de alta-performance
title Desenvolvimento de algoritmos para geração de modelos geoestatísticos usando aprendizado de máquina e computação de alta-performance
spellingShingle Desenvolvimento de algoritmos para geração de modelos geoestatísticos usando aprendizado de máquina e computação de alta-performance
Machado, Péricles Lopes
Simulação geoestatística
Otimização matemática
Aprendizado de máquina
Processamento de alto desempenho
Geostatistical simulation
Spectral methods
Machine learning
Cross validation
Optimization
title_short Desenvolvimento de algoritmos para geração de modelos geoestatísticos usando aprendizado de máquina e computação de alta-performance
title_full Desenvolvimento de algoritmos para geração de modelos geoestatísticos usando aprendizado de máquina e computação de alta-performance
title_fullStr Desenvolvimento de algoritmos para geração de modelos geoestatísticos usando aprendizado de máquina e computação de alta-performance
title_full_unstemmed Desenvolvimento de algoritmos para geração de modelos geoestatísticos usando aprendizado de máquina e computação de alta-performance
title_sort Desenvolvimento de algoritmos para geração de modelos geoestatísticos usando aprendizado de máquina e computação de alta-performance
author Machado, Péricles Lopes
author_facet Machado, Péricles Lopes
author_role author
dc.contributor.author.fl_str_mv Machado, Péricles Lopes
dc.contributor.advisor1.fl_str_mv Costa, Joao Felipe Coimbra Leite
contributor_str_mv Costa, Joao Felipe Coimbra Leite
dc.subject.por.fl_str_mv Simulação geoestatística
Otimização matemática
Aprendizado de máquina
Processamento de alto desempenho
topic Simulação geoestatística
Otimização matemática
Aprendizado de máquina
Processamento de alto desempenho
Geostatistical simulation
Spectral methods
Machine learning
Cross validation
Optimization
dc.subject.eng.fl_str_mv Geostatistical simulation
Spectral methods
Machine learning
Cross validation
Optimization
description A evolução na capacidade de processamento dos computadores viabilizou a implementação de algoritmos de simulação geoestatística. Por meio da simulação, é possível criar uma realização de uma função aleatória com as mesmas características estatísticas dos dados amostrais. Como, na prática, é necessária a geração de várias realizações, esse processo pode ser custoso computacionalmente. Principalmente, se a grade-alvo contiver muitas células. Por isso, nesse trabalho, estuda-se os métodos de simulação espectral (Bandas Rotatórias e Método Integral de Fourier) como alternativa ao algoritmo de Simulação Sequencial Gaussiana (SSG). Os métodos de simulação espectral eliminam a necessidade de um caminho aleatório no processo de geração da realização de uma função aleatória. Isso torna esses algoritmos extremamente amigáveis à aplicação de técnicas de paralelização e computação distribuída. Além disso, o esforço computacional necessário é significativamente reduzido. Conforme é mostrado nesse trabalho, a simulação espectral permite ganhos significativos de performance sem prejuízo na qualidade das realizações geradas. Além da utilização dos métodos espectrais como alternativa de alta performance à simulação geoestatística, são estudadas técnicas de otimização matemática para obtenção de modelos de covariância. Baseada na Busca Tabu, é construído um algoritmo para computação automática do modelo de covariância. Também, inspirado em técnicas de validação cruzada, como Jackknife e K-Fold, é construído um algoritmo de simulação chamado Ensemble Simulation. O algoritmo proposto utiliza otimização matemática para encontrar o modelo de covariância mais adequado para uma vizinhança, com uma função objetivo construída a partir do erro de validação. Portanto, por meio da otimização e do Ensemble Simulation é desenvolvido um modo de simular a função aleatória sem explicitamente definir um modelo de covariância. Tendo em vista que a modelagem manual do modelo de covariância é a tarefa mais dispendiosa do fluxo de trabalho da simulação geoestatística, essas técnicas permitem a automatização do processo. Em suma, nesse trabalho, são estudadas técnicas que viabilizam a automatização e melhoria da performance da simulação geoestatística e os resultados demonstram sua utilidade.
publishDate 2022
dc.date.accessioned.fl_str_mv 2022-10-07T04:51:36Z
dc.date.issued.fl_str_mv 2022
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/249828
dc.identifier.nrb.pt_BR.fl_str_mv 001149271
url http://hdl.handle.net/10183/249828
identifier_str_mv 001149271
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Biblioteca Digital de Teses e Dissertações da UFRGS
collection Biblioteca Digital de Teses e Dissertações da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/249828/2/001149271.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/249828/1/001149271.pdf
bitstream.checksum.fl_str_mv 71642b12cf569109637bbe38e2990e07
66cbd0400ba097d757cce69d49ccfe84
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv lume@ufrgs.br||lume@ufrgs.br
_version_ 1810085598762893312