Geoestatística na ausência de hard data : lidando com o erro amostral
Autor(a) principal: | |
---|---|
Data de Publicação: | 2020 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da UFRGS |
Texto Completo: | http://hdl.handle.net/10183/212233 |
Resumo: | Na geoestatística, são chamados de hard data as observações do fenômeno de interesse que sejam isentas de erro ou assumidas como tal. No entanto, tal tipo de dado não pode ser obtido experimentalmente, pois o erro amostral é intrinsicamente associado a qualquer processo de amostragem. Em dados reais, erros amostrais com variância correspondendo de 10% a 40% da variância total, os dados são considerados como boas práticas ou benchmarks, sendo, então, comumente assumidos como isentos de erro nas rotinas geoestatísticas. A proposta do trabalho é investigar se a hipótese de que assumir em problemas geoestatísticos dados reais como hard data é incorreta. Estatísticas como correlação espacial, as distribuições e a estrutura de correlação medida através de observações são combinações do comportamento do fenômeno real com o dos erros e, portanto, realizações estocásticas condicionadas a honrar os parâmetros das observações não são equiprováveis ao fenômeno real. Enquanto os fluxos de trabalhos convencionais geram realizações condicionadas a honrar os parâmetros e valores dos dados, esta tese apresenta uma série de métodos que possibilitam utilizar observações afetadas por erros para gerar realizações equiprováveis ao fenômeno real. A tese é separada em cinco partes: (i) é desenvolvido um modelo de erros generalizado, tanto univariado quanto multivariado; (ii) São apresentadas alternativas para estimar o erro associado a cada medição; (iii) o covariograma e a distribuição do fenômeno real são inferidos através dos valores amostrados, dos seus erros estimados e do covariograma e distribuição ajustada ao valores amostrados. No caso multivariado, também é inferida a estrutura de correlação entre as variáveis; (iv) bancos de dados de hard data são gerados ao substituir as observações iniciais por simulações de possíveis valores do fenômeno real. Cada banco de dados é utilizado para simular o fenômeno de interesse em todo o domínio, sendo tanto os bancos de dados quanto as realizações do modelo condicionadas a reproduzir estatísticas inferidas do fenômeno real. Por fim, a parte (v) apresenta as conclusões e propostas de novos trabalhos. Na tese são apresentados diversos exemplos como forma de elucidar o método e demonstrar o impacto e relevância de cada etapa. Os resultados do método proposto são a geração de modelos realmente equiprováveis ao fenômeno real e espaços de incerteza que reproduzem melhor a verdadeira distância entre o modelo e a realidade. |
id |
URGS_12340be5e9686ed710268a69af3e1ba7 |
---|---|
oai_identifier_str |
oai:www.lume.ufrgs.br:10183/212233 |
network_acronym_str |
URGS |
network_name_str |
Biblioteca Digital de Teses e Dissertações da UFRGS |
repository_id_str |
1853 |
spelling |
Silva, Victor MiguelCosta, Joao Felipe Coimbra Leite2020-07-21T03:35:59Z2020http://hdl.handle.net/10183/212233001115866Na geoestatística, são chamados de hard data as observações do fenômeno de interesse que sejam isentas de erro ou assumidas como tal. No entanto, tal tipo de dado não pode ser obtido experimentalmente, pois o erro amostral é intrinsicamente associado a qualquer processo de amostragem. Em dados reais, erros amostrais com variância correspondendo de 10% a 40% da variância total, os dados são considerados como boas práticas ou benchmarks, sendo, então, comumente assumidos como isentos de erro nas rotinas geoestatísticas. A proposta do trabalho é investigar se a hipótese de que assumir em problemas geoestatísticos dados reais como hard data é incorreta. Estatísticas como correlação espacial, as distribuições e a estrutura de correlação medida através de observações são combinações do comportamento do fenômeno real com o dos erros e, portanto, realizações estocásticas condicionadas a honrar os parâmetros das observações não são equiprováveis ao fenômeno real. Enquanto os fluxos de trabalhos convencionais geram realizações condicionadas a honrar os parâmetros e valores dos dados, esta tese apresenta uma série de métodos que possibilitam utilizar observações afetadas por erros para gerar realizações equiprováveis ao fenômeno real. A tese é separada em cinco partes: (i) é desenvolvido um modelo de erros generalizado, tanto univariado quanto multivariado; (ii) São apresentadas alternativas para estimar o erro associado a cada medição; (iii) o covariograma e a distribuição do fenômeno real são inferidos através dos valores amostrados, dos seus erros estimados e do covariograma e distribuição ajustada ao valores amostrados. No caso multivariado, também é inferida a estrutura de correlação entre as variáveis; (iv) bancos de dados de hard data são gerados ao substituir as observações iniciais por simulações de possíveis valores do fenômeno real. Cada banco de dados é utilizado para simular o fenômeno de interesse em todo o domínio, sendo tanto os bancos de dados quanto as realizações do modelo condicionadas a reproduzir estatísticas inferidas do fenômeno real. Por fim, a parte (v) apresenta as conclusões e propostas de novos trabalhos. Na tese são apresentados diversos exemplos como forma de elucidar o método e demonstrar o impacto e relevância de cada etapa. Os resultados do método proposto são a geração de modelos realmente equiprováveis ao fenômeno real e espaços de incerteza que reproduzem melhor a verdadeira distância entre o modelo e a realidade.Sampling error with variance corresponding to 10% to 40% of the total dataset variance are considered as good practice and frequently assumed as error-free data in the geostatistical workflow. The sampling error is intrinsically associated with any sampling process. Therefore, it is impossible to obtain in practice error-free observations of the phenomenon of interest (named as hard data). This thesis investigates the hypothesis that assuming the existence of hard data in geostatistical problems is incorrect and that impacts the quality of the simulated models. Spatial correlation, distribution and the structure of correlation measured by samples combine the real behavior of the underlying-true phenomenon and the sampling error behaviour. Realizations conditioned to honor the parameters fitted to observations are not equiprobable to the underlying true phenomenon. This thesis presents a number of methods that correctly manage data affected by sampling error. The thesis is separated into five parts: (i) a generalized error model that deals either with univariate and multivariate data is developed. In the multivariate case, the error associated with observations of different variables can be correlated; (ii) alternatives are presented to estimate the error associated with each observation; (iii) the covariogram and the distribution of the underlying-true phenomenon are inferred through statistics adjusted to the observations, their estimated associated errors, and the error behaviour associated to each observation. In the multivariate case, the structure of correlation between pairs of variables is inferred; (iv) hard data cannot be sampled, but equiprobable hard data values can be simulated. Data sets are generated by replacing initial observations by simulations of hard data. All realizations generated in the simulation steps are conditioned to reproduce the inferred statistics of the underlying true phenomenon. In the last part (v), discussions ands conclusions are presented. For sake of clarity, several short examples are presented to elucidate the method and demonstrate the impact and relevance of each step. The results of the proposed method are the generation of models with a better reproduction of what is supposed to be equiprobable realizations of the underlying true process, as well as improve the simulated space of uncertainty between the model and reality.application/pdfporErro amostralKrigagemSimulação geoestatísticaGeoestatísticaIncertezaSampling errorCo-krigingGeostatistical simulationGeostatisticsSpace of uncertaintyGeoestatística na ausência de hard data : lidando com o erro amostralinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisUniversidade Federal do Rio Grande do SulEscola de EngenhariaPrograma de Pós-Graduação em Engenharia de Minas, Metalúrgica e de MateriaisPorto Alegre, BR-RS2020doutoradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001115866.pdf.txt001115866.pdf.txtExtracted Texttext/plain186925http://www.lume.ufrgs.br/bitstream/10183/212233/2/001115866.pdf.txt0b2e844627b7c78132c9a6be4a0d91a8MD52ORIGINAL001115866.pdfTexto completoapplication/pdf3391415http://www.lume.ufrgs.br/bitstream/10183/212233/1/001115866.pdf292a5d77e1e5cb128cf0b166d66858f0MD5110183/2122332020-07-22 03:37:57.812987oai:www.lume.ufrgs.br:10183/212233Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532020-07-22T06:37:57Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false |
dc.title.pt_BR.fl_str_mv |
Geoestatística na ausência de hard data : lidando com o erro amostral |
title |
Geoestatística na ausência de hard data : lidando com o erro amostral |
spellingShingle |
Geoestatística na ausência de hard data : lidando com o erro amostral Silva, Victor Miguel Erro amostral Krigagem Simulação geoestatística Geoestatística Incerteza Sampling error Co-kriging Geostatistical simulation Geostatistics Space of uncertainty |
title_short |
Geoestatística na ausência de hard data : lidando com o erro amostral |
title_full |
Geoestatística na ausência de hard data : lidando com o erro amostral |
title_fullStr |
Geoestatística na ausência de hard data : lidando com o erro amostral |
title_full_unstemmed |
Geoestatística na ausência de hard data : lidando com o erro amostral |
title_sort |
Geoestatística na ausência de hard data : lidando com o erro amostral |
author |
Silva, Victor Miguel |
author_facet |
Silva, Victor Miguel |
author_role |
author |
dc.contributor.author.fl_str_mv |
Silva, Victor Miguel |
dc.contributor.advisor1.fl_str_mv |
Costa, Joao Felipe Coimbra Leite |
contributor_str_mv |
Costa, Joao Felipe Coimbra Leite |
dc.subject.por.fl_str_mv |
Erro amostral Krigagem Simulação geoestatística Geoestatística Incerteza |
topic |
Erro amostral Krigagem Simulação geoestatística Geoestatística Incerteza Sampling error Co-kriging Geostatistical simulation Geostatistics Space of uncertainty |
dc.subject.eng.fl_str_mv |
Sampling error Co-kriging Geostatistical simulation Geostatistics Space of uncertainty |
description |
Na geoestatística, são chamados de hard data as observações do fenômeno de interesse que sejam isentas de erro ou assumidas como tal. No entanto, tal tipo de dado não pode ser obtido experimentalmente, pois o erro amostral é intrinsicamente associado a qualquer processo de amostragem. Em dados reais, erros amostrais com variância correspondendo de 10% a 40% da variância total, os dados são considerados como boas práticas ou benchmarks, sendo, então, comumente assumidos como isentos de erro nas rotinas geoestatísticas. A proposta do trabalho é investigar se a hipótese de que assumir em problemas geoestatísticos dados reais como hard data é incorreta. Estatísticas como correlação espacial, as distribuições e a estrutura de correlação medida através de observações são combinações do comportamento do fenômeno real com o dos erros e, portanto, realizações estocásticas condicionadas a honrar os parâmetros das observações não são equiprováveis ao fenômeno real. Enquanto os fluxos de trabalhos convencionais geram realizações condicionadas a honrar os parâmetros e valores dos dados, esta tese apresenta uma série de métodos que possibilitam utilizar observações afetadas por erros para gerar realizações equiprováveis ao fenômeno real. A tese é separada em cinco partes: (i) é desenvolvido um modelo de erros generalizado, tanto univariado quanto multivariado; (ii) São apresentadas alternativas para estimar o erro associado a cada medição; (iii) o covariograma e a distribuição do fenômeno real são inferidos através dos valores amostrados, dos seus erros estimados e do covariograma e distribuição ajustada ao valores amostrados. No caso multivariado, também é inferida a estrutura de correlação entre as variáveis; (iv) bancos de dados de hard data são gerados ao substituir as observações iniciais por simulações de possíveis valores do fenômeno real. Cada banco de dados é utilizado para simular o fenômeno de interesse em todo o domínio, sendo tanto os bancos de dados quanto as realizações do modelo condicionadas a reproduzir estatísticas inferidas do fenômeno real. Por fim, a parte (v) apresenta as conclusões e propostas de novos trabalhos. Na tese são apresentados diversos exemplos como forma de elucidar o método e demonstrar o impacto e relevância de cada etapa. Os resultados do método proposto são a geração de modelos realmente equiprováveis ao fenômeno real e espaços de incerteza que reproduzem melhor a verdadeira distância entre o modelo e a realidade. |
publishDate |
2020 |
dc.date.accessioned.fl_str_mv |
2020-07-21T03:35:59Z |
dc.date.issued.fl_str_mv |
2020 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10183/212233 |
dc.identifier.nrb.pt_BR.fl_str_mv |
001115866 |
url |
http://hdl.handle.net/10183/212233 |
identifier_str_mv |
001115866 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UFRGS instname:Universidade Federal do Rio Grande do Sul (UFRGS) instacron:UFRGS |
instname_str |
Universidade Federal do Rio Grande do Sul (UFRGS) |
instacron_str |
UFRGS |
institution |
UFRGS |
reponame_str |
Biblioteca Digital de Teses e Dissertações da UFRGS |
collection |
Biblioteca Digital de Teses e Dissertações da UFRGS |
bitstream.url.fl_str_mv |
http://www.lume.ufrgs.br/bitstream/10183/212233/2/001115866.pdf.txt http://www.lume.ufrgs.br/bitstream/10183/212233/1/001115866.pdf |
bitstream.checksum.fl_str_mv |
0b2e844627b7c78132c9a6be4a0d91a8 292a5d77e1e5cb128cf0b166d66858f0 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS) |
repository.mail.fl_str_mv |
lume@ufrgs.br||lume@ufrgs.br |
_version_ |
1816737019494137856 |