Uso de informação secundária imprecisa como distribuição de probabilidade local em conjuntos de dados completamente heterotópicos

Detalhes bibliográficos
Autor(a) principal: Araújo, Cristina da Paixão
Data de Publicação: 2019
Tipo de documento: Tese
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da UFRGS
Texto Completo: http://hdl.handle.net/10183/197224
Resumo: Decisões na indústria mineral são geralmente baseadas em modelos estimados/simulados obtidos a partir de amostras. Durante a fase de exploração, as amostras são extraídas por furos de sondagem diamantados (DDH), que tendem a ser precisas e acuradas, mas são de alto custo e, consequentemente, escassas. Essas amostras são consideradas "hard data ou variável primária". Na fase de produção, as amostras podem ser coletadas por pó de perfuratriz ou amostras de fragmentos de rocha. Essas amostras são de baixo custo, abundantes e com alta incerteza. Portanto, tendem a existir mais dados com má qualidade, se comparado aos dados da fase de exploração. Essas amostras são consideradas “soft data ou variável secundária”. Abordagens clássicas em geoestatística, para integrar as variáveis primárias e secundárias, utilizam os algoritmos de cokrigagem e co-simulação, que requerem o modelo linear de coregionalização. A obtenção desse modelo pode ser considerado uma tarefa difícil quando existem duas ou mais variáveis secundárias disponíveis. Este trabalho propôs uma metodologia que, inicialmente, transforma os dados da variável secundária em variável primária a partir da construção distribuição probabilidade local a priori, incorporando a incerteza das medidas nas amostras, e em seguida executa o algorimo de simulação estocástica. Para dados que podem ter diferentes suporte, foi investigado o algoritmo de simulação sequencial direta com distribuições pontuais. Foram comparadas três metodologias: Metodologia 01: Simulação sequencial direta utilizando somente a variável primária, Metodologia 02: Simulação sequencial direta com distribuição pontual utilizando krigagem simples e na Metodologia 03: Simulação sequencial direta com distribuições pontuais utilizando cokrigagem simples com modelo intrínseco para inferir os pseudohards. Os resultados mostraram que quando os pseudohards são inferidos com o algoritmo de cokrigagem, e a correlação entre os dados é considerada, melhora a reprodução da distribuição local e os modelos são mais precisos e acurados . Para dados com mesmo suporte, tantos primários como secundários, foram avaliadas quatro metodologias definidas como: Metodologia 01: Simulação estocástica utilizando apenas a variável primária, Metodologia 02: Simulação estocástica utilizando a variável primária e secundária como distribuição bivariada normal, Metodologia 03: Simulação estocástica utilizando a variável primária e secundária como distribuição inferida por cokrigagem e Metodologia 04: Simulação estocástica utilizando inserção múltipla com atualização bayesiana no local da secundária. Verificou-se que a amostragem da distribuição de probabilidade pelo algoritmo de Monte Carlo (MCS), tem-se a reprodução da continuidade espacial dos pseudohards inferidos com flutuações ergódicas menores que o algoritmo de simulação por campos de probabilidade (p-field). Sobre a construção da distribuição, verificou-se que a distribuição local quando foram utilizados os dados da variável secundária no local e na vizinhança e a variável primária, os modelos finais foram mais precisos e acurados. Além disto, esta abordagem pode ser utilizada com qualquer algoritmo de simulação estocástica. As abordagens propostas apresentam duas vantagens: i) os erros da variável secundária são mitigados e não são transferidos para o modelo final ii) para incorporar a variável secundária é necessário somente o modelo de continuidade espacial da variável primária, evitando a modelagem do modelo linear de coregionalização (MLC). As metodologias propostas foram ilustradas em um banco de dados real, em 3D, em uma mina subterrânea de cobre e zinco, em que a variável primária e secundária possuem heterotopia total. Verificou-se, nas metodologias investigadas, que a informação secundária foi incorporada sem que o viés e a imprecisão fossem transferidos para os modelos. As metodologias produzem modelos mais precisos e acurados quando comparados aos gerados usando somente dados primários.
id URGS_39405d92a2d09c3d15332df2a7a6a908
oai_identifier_str oai:www.lume.ufrgs.br:10183/197224
network_acronym_str URGS
network_name_str Biblioteca Digital de Teses e Dissertações da UFRGS
repository_id_str 1853
spelling Araújo, Cristina da PaixãoCosta, Joao Felipe Coimbra LeiteSoares, Amilcar2019-07-20T02:34:22Z2019http://hdl.handle.net/10183/197224001096506Decisões na indústria mineral são geralmente baseadas em modelos estimados/simulados obtidos a partir de amostras. Durante a fase de exploração, as amostras são extraídas por furos de sondagem diamantados (DDH), que tendem a ser precisas e acuradas, mas são de alto custo e, consequentemente, escassas. Essas amostras são consideradas "hard data ou variável primária". Na fase de produção, as amostras podem ser coletadas por pó de perfuratriz ou amostras de fragmentos de rocha. Essas amostras são de baixo custo, abundantes e com alta incerteza. Portanto, tendem a existir mais dados com má qualidade, se comparado aos dados da fase de exploração. Essas amostras são consideradas “soft data ou variável secundária”. Abordagens clássicas em geoestatística, para integrar as variáveis primárias e secundárias, utilizam os algoritmos de cokrigagem e co-simulação, que requerem o modelo linear de coregionalização. A obtenção desse modelo pode ser considerado uma tarefa difícil quando existem duas ou mais variáveis secundárias disponíveis. Este trabalho propôs uma metodologia que, inicialmente, transforma os dados da variável secundária em variável primária a partir da construção distribuição probabilidade local a priori, incorporando a incerteza das medidas nas amostras, e em seguida executa o algorimo de simulação estocástica. Para dados que podem ter diferentes suporte, foi investigado o algoritmo de simulação sequencial direta com distribuições pontuais. Foram comparadas três metodologias: Metodologia 01: Simulação sequencial direta utilizando somente a variável primária, Metodologia 02: Simulação sequencial direta com distribuição pontual utilizando krigagem simples e na Metodologia 03: Simulação sequencial direta com distribuições pontuais utilizando cokrigagem simples com modelo intrínseco para inferir os pseudohards. Os resultados mostraram que quando os pseudohards são inferidos com o algoritmo de cokrigagem, e a correlação entre os dados é considerada, melhora a reprodução da distribuição local e os modelos são mais precisos e acurados . Para dados com mesmo suporte, tantos primários como secundários, foram avaliadas quatro metodologias definidas como: Metodologia 01: Simulação estocástica utilizando apenas a variável primária, Metodologia 02: Simulação estocástica utilizando a variável primária e secundária como distribuição bivariada normal, Metodologia 03: Simulação estocástica utilizando a variável primária e secundária como distribuição inferida por cokrigagem e Metodologia 04: Simulação estocástica utilizando inserção múltipla com atualização bayesiana no local da secundária. Verificou-se que a amostragem da distribuição de probabilidade pelo algoritmo de Monte Carlo (MCS), tem-se a reprodução da continuidade espacial dos pseudohards inferidos com flutuações ergódicas menores que o algoritmo de simulação por campos de probabilidade (p-field). Sobre a construção da distribuição, verificou-se que a distribuição local quando foram utilizados os dados da variável secundária no local e na vizinhança e a variável primária, os modelos finais foram mais precisos e acurados. Além disto, esta abordagem pode ser utilizada com qualquer algoritmo de simulação estocástica. As abordagens propostas apresentam duas vantagens: i) os erros da variável secundária são mitigados e não são transferidos para o modelo final ii) para incorporar a variável secundária é necessário somente o modelo de continuidade espacial da variável primária, evitando a modelagem do modelo linear de coregionalização (MLC). As metodologias propostas foram ilustradas em um banco de dados real, em 3D, em uma mina subterrânea de cobre e zinco, em que a variável primária e secundária possuem heterotopia total. Verificou-se, nas metodologias investigadas, que a informação secundária foi incorporada sem que o viés e a imprecisão fossem transferidos para os modelos. As metodologias produzem modelos mais precisos e acurados quando comparados aos gerados usando somente dados primários.Decisions in the mining industry are generally based on estimated/simulated models obtained from samples. During the exploration stage, samples obtained by diamond drilling holes (DDH) tend to be precise and accurate, but are expensive and, consequently, sparse. These samples are considered "hard data" or "primary variable". In the production stage, the samples are collected by reverse circulation or chip samples. These samples are cheaper, abundant and higher uncertainty than DDH. These samples are considered "soft data". Thus, there is a tendency to collect data in the production stage, instead of in the exploration stage, as the quantity of samples overcome its low. Classical approaches in geostatistics, to integrate primary and secondary variables, suggests that the use of cokriging and co-simulation algorithms requires a linear model of coregionalization (LMC). It can be considered a difficult task to obtained this model when two or more secondary variables are available. This study proposes a methodology that initially transforms the secondary variable into primary variable from local probability distribution by incorporating the uncertainty of the measurements in the samples. This approach is used to perform the stochastic simulation algorithm. To integrate data with different support, Direct sequential simulation with local distributions algorithm was investigated. Three methodologies was compared: Methodology 01: Direct sequential simulation using only the primary variable; Methodology 02: Direct sequential simulation with local distribution using simple kriging; Methodology 03: Direct sequential simulation with local distributions using simple cokriging with intrinsic model to infer pseudohards. The results showed that the pseudohards were inferred with the cokriging algorithm and the correlation between variables was considered. It improves the reproduction of the local distribution and the final models are more precise and accurate. To incorporate primary and secondary variables with the same support, four methodologies was evaluated: Methodology 01:Stochastic simulation using only the primary variable; Methodology 02:Stochastic simulation using the primary and secondary variable as normal bivariate distribution; Methodology 03:Stochastic simulation using the primary and secondary variables as a distribution inferred by cokriging with intrinsic model; Methodology 04:Stochastic simulation using multiple imputation with Bayesian update at secondary variable location. The results showed that the spatial continuity reproduction of the pseudohards has less ergodic fluctuations in the probability distribution sampling by the Monte Carlo algorithm (MCS) than the sampling by p-field simulation algorithm. To build the distribution, the local distribution was verified when both secondary and primary variables were used. The secondary variable considered locally and in the neighborhood. The final models were more precise and accurate. In addition, this approach can be used with any stochastic simulation algorithm. The proposed approaches have two main advantages: i) the errors of the secondary variable are mitigated and are not transferred to the final model; ii) to incorporate the secondary variable it is necessary only the spatial continuity model of the primary variable, avoiding the modeling of the LMC. The developed methodologies were applied in a real case study, copper and zinc underground mine, where the primary and secondary variables are completely heterotopic. It was verified that bias and imprecision of the secondary data were not transferred to the final models. The methodologies produce more precise and accurate models when compared to models obtained using only primary data.application/pdfporIndústria mineralGeoestatísticaSimulação estocásticaUso de informação secundária imprecisa como distribuição de probabilidade local em conjuntos de dados completamente heterotópicosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisUniversidade Federal do Rio Grande do SulEscola de EngenhariaPrograma de Pós-Graduação em Engenharia de Minas, Metalúrgica e de MateriaisPorto Alegre, BR-RS2019doutoradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001096506.pdf.txt001096506.pdf.txtExtracted Texttext/plain194243http://www.lume.ufrgs.br/bitstream/10183/197224/2/001096506.pdf.txt9934bc9efdab3f79b429cec7c71cc450MD52ORIGINAL001096506.pdfTexto completoapplication/pdf3585956http://www.lume.ufrgs.br/bitstream/10183/197224/1/001096506.pdf5f5653b18c5acfdf22fefe9c586e7d08MD5110183/1972242019-07-21 02:42:43.009223oai:www.lume.ufrgs.br:10183/197224Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532019-07-21T05:42:43Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Uso de informação secundária imprecisa como distribuição de probabilidade local em conjuntos de dados completamente heterotópicos
title Uso de informação secundária imprecisa como distribuição de probabilidade local em conjuntos de dados completamente heterotópicos
spellingShingle Uso de informação secundária imprecisa como distribuição de probabilidade local em conjuntos de dados completamente heterotópicos
Araújo, Cristina da Paixão
Indústria mineral
Geoestatística
Simulação estocástica
title_short Uso de informação secundária imprecisa como distribuição de probabilidade local em conjuntos de dados completamente heterotópicos
title_full Uso de informação secundária imprecisa como distribuição de probabilidade local em conjuntos de dados completamente heterotópicos
title_fullStr Uso de informação secundária imprecisa como distribuição de probabilidade local em conjuntos de dados completamente heterotópicos
title_full_unstemmed Uso de informação secundária imprecisa como distribuição de probabilidade local em conjuntos de dados completamente heterotópicos
title_sort Uso de informação secundária imprecisa como distribuição de probabilidade local em conjuntos de dados completamente heterotópicos
author Araújo, Cristina da Paixão
author_facet Araújo, Cristina da Paixão
author_role author
dc.contributor.author.fl_str_mv Araújo, Cristina da Paixão
dc.contributor.advisor1.fl_str_mv Costa, Joao Felipe Coimbra Leite
dc.contributor.advisor-co1.fl_str_mv Soares, Amilcar
contributor_str_mv Costa, Joao Felipe Coimbra Leite
Soares, Amilcar
dc.subject.por.fl_str_mv Indústria mineral
Geoestatística
Simulação estocástica
topic Indústria mineral
Geoestatística
Simulação estocástica
description Decisões na indústria mineral são geralmente baseadas em modelos estimados/simulados obtidos a partir de amostras. Durante a fase de exploração, as amostras são extraídas por furos de sondagem diamantados (DDH), que tendem a ser precisas e acuradas, mas são de alto custo e, consequentemente, escassas. Essas amostras são consideradas "hard data ou variável primária". Na fase de produção, as amostras podem ser coletadas por pó de perfuratriz ou amostras de fragmentos de rocha. Essas amostras são de baixo custo, abundantes e com alta incerteza. Portanto, tendem a existir mais dados com má qualidade, se comparado aos dados da fase de exploração. Essas amostras são consideradas “soft data ou variável secundária”. Abordagens clássicas em geoestatística, para integrar as variáveis primárias e secundárias, utilizam os algoritmos de cokrigagem e co-simulação, que requerem o modelo linear de coregionalização. A obtenção desse modelo pode ser considerado uma tarefa difícil quando existem duas ou mais variáveis secundárias disponíveis. Este trabalho propôs uma metodologia que, inicialmente, transforma os dados da variável secundária em variável primária a partir da construção distribuição probabilidade local a priori, incorporando a incerteza das medidas nas amostras, e em seguida executa o algorimo de simulação estocástica. Para dados que podem ter diferentes suporte, foi investigado o algoritmo de simulação sequencial direta com distribuições pontuais. Foram comparadas três metodologias: Metodologia 01: Simulação sequencial direta utilizando somente a variável primária, Metodologia 02: Simulação sequencial direta com distribuição pontual utilizando krigagem simples e na Metodologia 03: Simulação sequencial direta com distribuições pontuais utilizando cokrigagem simples com modelo intrínseco para inferir os pseudohards. Os resultados mostraram que quando os pseudohards são inferidos com o algoritmo de cokrigagem, e a correlação entre os dados é considerada, melhora a reprodução da distribuição local e os modelos são mais precisos e acurados . Para dados com mesmo suporte, tantos primários como secundários, foram avaliadas quatro metodologias definidas como: Metodologia 01: Simulação estocástica utilizando apenas a variável primária, Metodologia 02: Simulação estocástica utilizando a variável primária e secundária como distribuição bivariada normal, Metodologia 03: Simulação estocástica utilizando a variável primária e secundária como distribuição inferida por cokrigagem e Metodologia 04: Simulação estocástica utilizando inserção múltipla com atualização bayesiana no local da secundária. Verificou-se que a amostragem da distribuição de probabilidade pelo algoritmo de Monte Carlo (MCS), tem-se a reprodução da continuidade espacial dos pseudohards inferidos com flutuações ergódicas menores que o algoritmo de simulação por campos de probabilidade (p-field). Sobre a construção da distribuição, verificou-se que a distribuição local quando foram utilizados os dados da variável secundária no local e na vizinhança e a variável primária, os modelos finais foram mais precisos e acurados. Além disto, esta abordagem pode ser utilizada com qualquer algoritmo de simulação estocástica. As abordagens propostas apresentam duas vantagens: i) os erros da variável secundária são mitigados e não são transferidos para o modelo final ii) para incorporar a variável secundária é necessário somente o modelo de continuidade espacial da variável primária, evitando a modelagem do modelo linear de coregionalização (MLC). As metodologias propostas foram ilustradas em um banco de dados real, em 3D, em uma mina subterrânea de cobre e zinco, em que a variável primária e secundária possuem heterotopia total. Verificou-se, nas metodologias investigadas, que a informação secundária foi incorporada sem que o viés e a imprecisão fossem transferidos para os modelos. As metodologias produzem modelos mais precisos e acurados quando comparados aos gerados usando somente dados primários.
publishDate 2019
dc.date.accessioned.fl_str_mv 2019-07-20T02:34:22Z
dc.date.issued.fl_str_mv 2019
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/197224
dc.identifier.nrb.pt_BR.fl_str_mv 001096506
url http://hdl.handle.net/10183/197224
identifier_str_mv 001096506
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Biblioteca Digital de Teses e Dissertações da UFRGS
collection Biblioteca Digital de Teses e Dissertações da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/197224/2/001096506.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/197224/1/001096506.pdf
bitstream.checksum.fl_str_mv 9934bc9efdab3f79b429cec7c71cc450
5f5653b18c5acfdf22fefe9c586e7d08
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv lume@ufrgs.br||lume@ufrgs.br
_version_ 1800309149043523584