Multiple imputation to fill in missing data in soil physico-hydricalproperties database.
Autor(a) principal: | |
---|---|
Data de Publicação: | 2020 |
Outros Autores: | , , , |
Tipo de documento: | Artigo |
Idioma: | eng |
Título da fonte: | Repositório Institucional da EMBRAPA (Repository Open Access to Scientific Information from EMBRAPA - Alice) |
Texto Completo: | http://www.alice.cnptia.embrapa.br/alice/handle/doc/1130368 |
Resumo: | Valores faltantes em banco de dados é um problema comum e quase inevitável. A imputação múltipla (IM) é ummétodo estatístico eficiente para estimar valores ausentes em um conjunto de dados incompleto. Para testar essa abordagemem um banco de dados de solo, hipotetizamos que a imputação de dados ausentes fornece um banco de dados estatisticamentemais preciso do que a análise de casos completos (ACC). O objetivo geral do estudo foi avaliar a eficiência da IM usando oalgoritmo MICE (Imputação Multivariada por Equações Encadeadas) para preencher dados ausentes em um banco de dadosde propriedades físico-hídricas do solo e mostrar que é mais viável realizar a imputação do que a ACC. Análise preliminar dobanco de dados foi realizada para verificar a adequação do algoritmo proposto. A imputação dos dados faltantes de cada variávelfoi ajustada usando modelos de regressão linear. Variáveis com dados faltantes entram no modelo como variável dependente eas outras como covariáveis. As análises foram realizadas comparando os valores das estimativas, seus erros padrão e intervalosde confiança de 95%. O padrão de faltas foi do tipo multivariado arbitrário e, a matéria orgânica foi a variável com a maiorquantidade de dados faltantes. A significância das covariáveis variou de acordo com a variável a ser estimada. Os resultadosmostraram que o MICE apresentou melhor desempenho que a ACC, pois, embora a comparação estatística dos dois métodostenha sido semelhante, a imputação múltipla mantém o tamanho do banco de dados e preserva a distribuição geral |
id |
EMBR_5e50b2f1d49e0dbb76fd7644206479f8 |
---|---|
oai_identifier_str |
oai:www.alice.cnptia.embrapa.br:doc/1130368 |
network_acronym_str |
EMBR |
network_name_str |
Repositório Institucional da EMBRAPA (Repository Open Access to Scientific Information from EMBRAPA - Alice) |
repository_id_str |
2154 |
spelling |
Multiple imputation to fill in missing data in soil physico-hydricalproperties database.Propriedades físico-hídricasPreditores de faltaDados incompletosMonte Carlo via Cadeias de MarkovBase de DadosSoloValores faltantes em banco de dados é um problema comum e quase inevitável. A imputação múltipla (IM) é ummétodo estatístico eficiente para estimar valores ausentes em um conjunto de dados incompleto. Para testar essa abordagemem um banco de dados de solo, hipotetizamos que a imputação de dados ausentes fornece um banco de dados estatisticamentemais preciso do que a análise de casos completos (ACC). O objetivo geral do estudo foi avaliar a eficiência da IM usando oalgoritmo MICE (Imputação Multivariada por Equações Encadeadas) para preencher dados ausentes em um banco de dadosde propriedades físico-hídricas do solo e mostrar que é mais viável realizar a imputação do que a ACC. Análise preliminar dobanco de dados foi realizada para verificar a adequação do algoritmo proposto. A imputação dos dados faltantes de cada variávelfoi ajustada usando modelos de regressão linear. Variáveis com dados faltantes entram no modelo como variável dependente eas outras como covariáveis. As análises foram realizadas comparando os valores das estimativas, seus erros padrão e intervalosde confiança de 95%. O padrão de faltas foi do tipo multivariado arbitrário e, a matéria orgânica foi a variável com a maiorquantidade de dados faltantes. A significância das covariáveis variou de acordo com a variável a ser estimada. Os resultadosmostraram que o MICE apresentou melhor desempenho que a ACC, pois, embora a comparação estatística dos dois métodostenha sido semelhante, a imputação múltipla mantém o tamanho do banco de dados e preserva a distribuição geralLuciana Maria de Oliveira, UFRA; Herdjania Veras de Lima, UFRA; Sueli Rodrigues, UFPI; EDUARDO JORGE MAKLOUF CARVALHO, CPATU; Lorena Chagas Torres, UFRA.OLIVEIRA, L. M. deLIMA, H. V. deRODRIGUES, S.CARVALHO, E. J. M.TORRES, L. C.2021-03-01T12:01:28Z2021-03-01T12:01:28Z2021-03-012020info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/articleRevista Ciência Agronômica, v. 51, n. 4, e20196817, 2020.http://www.alice.cnptia.embrapa.br/alice/handle/doc/113036810.5935/1806-6690.20200079enginfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da EMBRAPA (Repository Open Access to Scientific Information from EMBRAPA - Alice)instname:Empresa Brasileira de Pesquisa Agropecuária (Embrapa)instacron:EMBRAPA2021-03-01T12:01:38Zoai:www.alice.cnptia.embrapa.br:doc/1130368Repositório InstitucionalPUBhttps://www.alice.cnptia.embrapa.br/oai/requestopendoar:21542021-03-01T12:01:38falseRepositório InstitucionalPUBhttps://www.alice.cnptia.embrapa.br/oai/requestcg-riaa@embrapa.bropendoar:21542021-03-01T12:01:38Repositório Institucional da EMBRAPA (Repository Open Access to Scientific Information from EMBRAPA - Alice) - Empresa Brasileira de Pesquisa Agropecuária (Embrapa)false |
dc.title.none.fl_str_mv |
Multiple imputation to fill in missing data in soil physico-hydricalproperties database. |
title |
Multiple imputation to fill in missing data in soil physico-hydricalproperties database. |
spellingShingle |
Multiple imputation to fill in missing data in soil physico-hydricalproperties database. OLIVEIRA, L. M. de Propriedades físico-hídricas Preditores de falta Dados incompletos Monte Carlo via Cadeias de Markov Base de Dados Solo |
title_short |
Multiple imputation to fill in missing data in soil physico-hydricalproperties database. |
title_full |
Multiple imputation to fill in missing data in soil physico-hydricalproperties database. |
title_fullStr |
Multiple imputation to fill in missing data in soil physico-hydricalproperties database. |
title_full_unstemmed |
Multiple imputation to fill in missing data in soil physico-hydricalproperties database. |
title_sort |
Multiple imputation to fill in missing data in soil physico-hydricalproperties database. |
author |
OLIVEIRA, L. M. de |
author_facet |
OLIVEIRA, L. M. de LIMA, H. V. de RODRIGUES, S. CARVALHO, E. J. M. TORRES, L. C. |
author_role |
author |
author2 |
LIMA, H. V. de RODRIGUES, S. CARVALHO, E. J. M. TORRES, L. C. |
author2_role |
author author author author |
dc.contributor.none.fl_str_mv |
Luciana Maria de Oliveira, UFRA; Herdjania Veras de Lima, UFRA; Sueli Rodrigues, UFPI; EDUARDO JORGE MAKLOUF CARVALHO, CPATU; Lorena Chagas Torres, UFRA. |
dc.contributor.author.fl_str_mv |
OLIVEIRA, L. M. de LIMA, H. V. de RODRIGUES, S. CARVALHO, E. J. M. TORRES, L. C. |
dc.subject.por.fl_str_mv |
Propriedades físico-hídricas Preditores de falta Dados incompletos Monte Carlo via Cadeias de Markov Base de Dados Solo |
topic |
Propriedades físico-hídricas Preditores de falta Dados incompletos Monte Carlo via Cadeias de Markov Base de Dados Solo |
description |
Valores faltantes em banco de dados é um problema comum e quase inevitável. A imputação múltipla (IM) é ummétodo estatístico eficiente para estimar valores ausentes em um conjunto de dados incompleto. Para testar essa abordagemem um banco de dados de solo, hipotetizamos que a imputação de dados ausentes fornece um banco de dados estatisticamentemais preciso do que a análise de casos completos (ACC). O objetivo geral do estudo foi avaliar a eficiência da IM usando oalgoritmo MICE (Imputação Multivariada por Equações Encadeadas) para preencher dados ausentes em um banco de dadosde propriedades físico-hídricas do solo e mostrar que é mais viável realizar a imputação do que a ACC. Análise preliminar dobanco de dados foi realizada para verificar a adequação do algoritmo proposto. A imputação dos dados faltantes de cada variávelfoi ajustada usando modelos de regressão linear. Variáveis com dados faltantes entram no modelo como variável dependente eas outras como covariáveis. As análises foram realizadas comparando os valores das estimativas, seus erros padrão e intervalosde confiança de 95%. O padrão de faltas foi do tipo multivariado arbitrário e, a matéria orgânica foi a variável com a maiorquantidade de dados faltantes. A significância das covariáveis variou de acordo com a variável a ser estimada. Os resultadosmostraram que o MICE apresentou melhor desempenho que a ACC, pois, embora a comparação estatística dos dois métodostenha sido semelhante, a imputação múltipla mantém o tamanho do banco de dados e preserva a distribuição geral |
publishDate |
2020 |
dc.date.none.fl_str_mv |
2020 2021-03-01T12:01:28Z 2021-03-01T12:01:28Z 2021-03-01 |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/article |
format |
article |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
Revista Ciência Agronômica, v. 51, n. 4, e20196817, 2020. http://www.alice.cnptia.embrapa.br/alice/handle/doc/1130368 10.5935/1806-6690.20200079 |
identifier_str_mv |
Revista Ciência Agronômica, v. 51, n. 4, e20196817, 2020. 10.5935/1806-6690.20200079 |
url |
http://www.alice.cnptia.embrapa.br/alice/handle/doc/1130368 |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da EMBRAPA (Repository Open Access to Scientific Information from EMBRAPA - Alice) instname:Empresa Brasileira de Pesquisa Agropecuária (Embrapa) instacron:EMBRAPA |
instname_str |
Empresa Brasileira de Pesquisa Agropecuária (Embrapa) |
instacron_str |
EMBRAPA |
institution |
EMBRAPA |
reponame_str |
Repositório Institucional da EMBRAPA (Repository Open Access to Scientific Information from EMBRAPA - Alice) |
collection |
Repositório Institucional da EMBRAPA (Repository Open Access to Scientific Information from EMBRAPA - Alice) |
repository.name.fl_str_mv |
Repositório Institucional da EMBRAPA (Repository Open Access to Scientific Information from EMBRAPA - Alice) - Empresa Brasileira de Pesquisa Agropecuária (Embrapa) |
repository.mail.fl_str_mv |
cg-riaa@embrapa.br |
_version_ |
1794503503309176832 |