Geoestatística na ausência de hard data : lidando com o erro amostral

Detalhes bibliográficos
Autor(a) principal: Silva, Victor Miguel
Data de Publicação: 2020
Tipo de documento: Tese
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da UFRGS
Texto Completo: http://hdl.handle.net/10183/212233
Resumo: Na geoestatística, são chamados de hard data as observações do fenômeno de interesse que sejam isentas de erro ou assumidas como tal. No entanto, tal tipo de dado não pode ser obtido experimentalmente, pois o erro amostral é intrinsicamente associado a qualquer processo de amostragem. Em dados reais, erros amostrais com variância correspondendo de 10% a 40% da variância total, os dados são considerados como boas práticas ou benchmarks, sendo, então, comumente assumidos como isentos de erro nas rotinas geoestatísticas. A proposta do trabalho é investigar se a hipótese de que assumir em problemas geoestatísticos dados reais como hard data é incorreta. Estatísticas como correlação espacial, as distribuições e a estrutura de correlação medida através de observações são combinações do comportamento do fenômeno real com o dos erros e, portanto, realizações estocásticas condicionadas a honrar os parâmetros das observações não são equiprováveis ao fenômeno real. Enquanto os fluxos de trabalhos convencionais geram realizações condicionadas a honrar os parâmetros e valores dos dados, esta tese apresenta uma série de métodos que possibilitam utilizar observações afetadas por erros para gerar realizações equiprováveis ao fenômeno real. A tese é separada em cinco partes: (i) é desenvolvido um modelo de erros generalizado, tanto univariado quanto multivariado; (ii) São apresentadas alternativas para estimar o erro associado a cada medição; (iii) o covariograma e a distribuição do fenômeno real são inferidos através dos valores amostrados, dos seus erros estimados e do covariograma e distribuição ajustada ao valores amostrados. No caso multivariado, também é inferida a estrutura de correlação entre as variáveis; (iv) bancos de dados de hard data são gerados ao substituir as observações iniciais por simulações de possíveis valores do fenômeno real. Cada banco de dados é utilizado para simular o fenômeno de interesse em todo o domínio, sendo tanto os bancos de dados quanto as realizações do modelo condicionadas a reproduzir estatísticas inferidas do fenômeno real. Por fim, a parte (v) apresenta as conclusões e propostas de novos trabalhos. Na tese são apresentados diversos exemplos como forma de elucidar o método e demonstrar o impacto e relevância de cada etapa. Os resultados do método proposto são a geração de modelos realmente equiprováveis ao fenômeno real e espaços de incerteza que reproduzem melhor a verdadeira distância entre o modelo e a realidade.
id URGS_12340be5e9686ed710268a69af3e1ba7
oai_identifier_str oai:www.lume.ufrgs.br:10183/212233
network_acronym_str URGS
network_name_str Biblioteca Digital de Teses e Dissertações da UFRGS
repository_id_str 1853
spelling Silva, Victor MiguelCosta, Joao Felipe Coimbra Leite2020-07-21T03:35:59Z2020http://hdl.handle.net/10183/212233001115866Na geoestatística, são chamados de hard data as observações do fenômeno de interesse que sejam isentas de erro ou assumidas como tal. No entanto, tal tipo de dado não pode ser obtido experimentalmente, pois o erro amostral é intrinsicamente associado a qualquer processo de amostragem. Em dados reais, erros amostrais com variância correspondendo de 10% a 40% da variância total, os dados são considerados como boas práticas ou benchmarks, sendo, então, comumente assumidos como isentos de erro nas rotinas geoestatísticas. A proposta do trabalho é investigar se a hipótese de que assumir em problemas geoestatísticos dados reais como hard data é incorreta. Estatísticas como correlação espacial, as distribuições e a estrutura de correlação medida através de observações são combinações do comportamento do fenômeno real com o dos erros e, portanto, realizações estocásticas condicionadas a honrar os parâmetros das observações não são equiprováveis ao fenômeno real. Enquanto os fluxos de trabalhos convencionais geram realizações condicionadas a honrar os parâmetros e valores dos dados, esta tese apresenta uma série de métodos que possibilitam utilizar observações afetadas por erros para gerar realizações equiprováveis ao fenômeno real. A tese é separada em cinco partes: (i) é desenvolvido um modelo de erros generalizado, tanto univariado quanto multivariado; (ii) São apresentadas alternativas para estimar o erro associado a cada medição; (iii) o covariograma e a distribuição do fenômeno real são inferidos através dos valores amostrados, dos seus erros estimados e do covariograma e distribuição ajustada ao valores amostrados. No caso multivariado, também é inferida a estrutura de correlação entre as variáveis; (iv) bancos de dados de hard data são gerados ao substituir as observações iniciais por simulações de possíveis valores do fenômeno real. Cada banco de dados é utilizado para simular o fenômeno de interesse em todo o domínio, sendo tanto os bancos de dados quanto as realizações do modelo condicionadas a reproduzir estatísticas inferidas do fenômeno real. Por fim, a parte (v) apresenta as conclusões e propostas de novos trabalhos. Na tese são apresentados diversos exemplos como forma de elucidar o método e demonstrar o impacto e relevância de cada etapa. Os resultados do método proposto são a geração de modelos realmente equiprováveis ao fenômeno real e espaços de incerteza que reproduzem melhor a verdadeira distância entre o modelo e a realidade.Sampling error with variance corresponding to 10% to 40% of the total dataset variance are considered as good practice and frequently assumed as error-free data in the geostatistical workflow. The sampling error is intrinsically associated with any sampling process. Therefore, it is impossible to obtain in practice error-free observations of the phenomenon of interest (named as hard data). This thesis investigates the hypothesis that assuming the existence of hard data in geostatistical problems is incorrect and that impacts the quality of the simulated models. Spatial correlation, distribution and the structure of correlation measured by samples combine the real behavior of the underlying-true phenomenon and the sampling error behaviour. Realizations conditioned to honor the parameters fitted to observations are not equiprobable to the underlying true phenomenon. This thesis presents a number of methods that correctly manage data affected by sampling error. The thesis is separated into five parts: (i) a generalized error model that deals either with univariate and multivariate data is developed. In the multivariate case, the error associated with observations of different variables can be correlated; (ii) alternatives are presented to estimate the error associated with each observation; (iii) the covariogram and the distribution of the underlying-true phenomenon are inferred through statistics adjusted to the observations, their estimated associated errors, and the error behaviour associated to each observation. In the multivariate case, the structure of correlation between pairs of variables is inferred; (iv) hard data cannot be sampled, but equiprobable hard data values can be simulated. Data sets are generated by replacing initial observations by simulations of hard data. All realizations generated in the simulation steps are conditioned to reproduce the inferred statistics of the underlying true phenomenon. In the last part (v), discussions ands conclusions are presented. For sake of clarity, several short examples are presented to elucidate the method and demonstrate the impact and relevance of each step. The results of the proposed method are the generation of models with a better reproduction of what is supposed to be equiprobable realizations of the underlying true process, as well as improve the simulated space of uncertainty between the model and reality.application/pdfporErro amostralKrigagemSimulação geoestatísticaGeoestatísticaIncertezaSampling errorCo-krigingGeostatistical simulationGeostatisticsSpace of uncertaintyGeoestatística na ausência de hard data : lidando com o erro amostralinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisUniversidade Federal do Rio Grande do SulEscola de EngenhariaPrograma de Pós-Graduação em Engenharia de Minas, Metalúrgica e de MateriaisPorto Alegre, BR-RS2020doutoradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001115866.pdf.txt001115866.pdf.txtExtracted Texttext/plain186925http://www.lume.ufrgs.br/bitstream/10183/212233/2/001115866.pdf.txt0b2e844627b7c78132c9a6be4a0d91a8MD52ORIGINAL001115866.pdfTexto completoapplication/pdf3391415http://www.lume.ufrgs.br/bitstream/10183/212233/1/001115866.pdf292a5d77e1e5cb128cf0b166d66858f0MD5110183/2122332020-07-22 03:37:57.812987oai:www.lume.ufrgs.br:10183/212233Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532020-07-22T06:37:57Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Geoestatística na ausência de hard data : lidando com o erro amostral
title Geoestatística na ausência de hard data : lidando com o erro amostral
spellingShingle Geoestatística na ausência de hard data : lidando com o erro amostral
Silva, Victor Miguel
Erro amostral
Krigagem
Simulação geoestatística
Geoestatística
Incerteza
Sampling error
Co-kriging
Geostatistical simulation
Geostatistics
Space of uncertainty
title_short Geoestatística na ausência de hard data : lidando com o erro amostral
title_full Geoestatística na ausência de hard data : lidando com o erro amostral
title_fullStr Geoestatística na ausência de hard data : lidando com o erro amostral
title_full_unstemmed Geoestatística na ausência de hard data : lidando com o erro amostral
title_sort Geoestatística na ausência de hard data : lidando com o erro amostral
author Silva, Victor Miguel
author_facet Silva, Victor Miguel
author_role author
dc.contributor.author.fl_str_mv Silva, Victor Miguel
dc.contributor.advisor1.fl_str_mv Costa, Joao Felipe Coimbra Leite
contributor_str_mv Costa, Joao Felipe Coimbra Leite
dc.subject.por.fl_str_mv Erro amostral
Krigagem
Simulação geoestatística
Geoestatística
Incerteza
topic Erro amostral
Krigagem
Simulação geoestatística
Geoestatística
Incerteza
Sampling error
Co-kriging
Geostatistical simulation
Geostatistics
Space of uncertainty
dc.subject.eng.fl_str_mv Sampling error
Co-kriging
Geostatistical simulation
Geostatistics
Space of uncertainty
description Na geoestatística, são chamados de hard data as observações do fenômeno de interesse que sejam isentas de erro ou assumidas como tal. No entanto, tal tipo de dado não pode ser obtido experimentalmente, pois o erro amostral é intrinsicamente associado a qualquer processo de amostragem. Em dados reais, erros amostrais com variância correspondendo de 10% a 40% da variância total, os dados são considerados como boas práticas ou benchmarks, sendo, então, comumente assumidos como isentos de erro nas rotinas geoestatísticas. A proposta do trabalho é investigar se a hipótese de que assumir em problemas geoestatísticos dados reais como hard data é incorreta. Estatísticas como correlação espacial, as distribuições e a estrutura de correlação medida através de observações são combinações do comportamento do fenômeno real com o dos erros e, portanto, realizações estocásticas condicionadas a honrar os parâmetros das observações não são equiprováveis ao fenômeno real. Enquanto os fluxos de trabalhos convencionais geram realizações condicionadas a honrar os parâmetros e valores dos dados, esta tese apresenta uma série de métodos que possibilitam utilizar observações afetadas por erros para gerar realizações equiprováveis ao fenômeno real. A tese é separada em cinco partes: (i) é desenvolvido um modelo de erros generalizado, tanto univariado quanto multivariado; (ii) São apresentadas alternativas para estimar o erro associado a cada medição; (iii) o covariograma e a distribuição do fenômeno real são inferidos através dos valores amostrados, dos seus erros estimados e do covariograma e distribuição ajustada ao valores amostrados. No caso multivariado, também é inferida a estrutura de correlação entre as variáveis; (iv) bancos de dados de hard data são gerados ao substituir as observações iniciais por simulações de possíveis valores do fenômeno real. Cada banco de dados é utilizado para simular o fenômeno de interesse em todo o domínio, sendo tanto os bancos de dados quanto as realizações do modelo condicionadas a reproduzir estatísticas inferidas do fenômeno real. Por fim, a parte (v) apresenta as conclusões e propostas de novos trabalhos. Na tese são apresentados diversos exemplos como forma de elucidar o método e demonstrar o impacto e relevância de cada etapa. Os resultados do método proposto são a geração de modelos realmente equiprováveis ao fenômeno real e espaços de incerteza que reproduzem melhor a verdadeira distância entre o modelo e a realidade.
publishDate 2020
dc.date.accessioned.fl_str_mv 2020-07-21T03:35:59Z
dc.date.issued.fl_str_mv 2020
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/212233
dc.identifier.nrb.pt_BR.fl_str_mv 001115866
url http://hdl.handle.net/10183/212233
identifier_str_mv 001115866
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Biblioteca Digital de Teses e Dissertações da UFRGS
collection Biblioteca Digital de Teses e Dissertações da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/212233/2/001115866.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/212233/1/001115866.pdf
bitstream.checksum.fl_str_mv 0b2e844627b7c78132c9a6be4a0d91a8
292a5d77e1e5cb128cf0b166d66858f0
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv lume@ufrgs.br||lume@ufrgs.br
_version_ 1816737019494137856