Multiple imputation to fill in missing data in soil physico-hydricalproperties database.

Detalhes bibliográficos
Autor(a) principal: OLIVEIRA, L. M. de
Data de Publicação: 2020
Outros Autores: LIMA, H. V. de, RODRIGUES, S., CARVALHO, E. J. M., TORRES, L. C.
Tipo de documento: Artigo
Idioma: eng
Título da fonte: Repositório Institucional da EMBRAPA (Repository Open Access to Scientific Information from EMBRAPA - Alice)
Texto Completo: http://www.alice.cnptia.embrapa.br/alice/handle/doc/1130368
Resumo: Valores faltantes em banco de dados é um problema comum e quase inevitável. A imputação múltipla (IM) é ummétodo estatístico eficiente para estimar valores ausentes em um conjunto de dados incompleto. Para testar essa abordagemem um banco de dados de solo, hipotetizamos que a imputação de dados ausentes fornece um banco de dados estatisticamentemais preciso do que a análise de casos completos (ACC). O objetivo geral do estudo foi avaliar a eficiência da IM usando oalgoritmo MICE (Imputação Multivariada por Equações Encadeadas) para preencher dados ausentes em um banco de dadosde propriedades físico-hídricas do solo e mostrar que é mais viável realizar a imputação do que a ACC. Análise preliminar dobanco de dados foi realizada para verificar a adequação do algoritmo proposto. A imputação dos dados faltantes de cada variávelfoi ajustada usando modelos de regressão linear. Variáveis com dados faltantes entram no modelo como variável dependente eas outras como covariáveis. As análises foram realizadas comparando os valores das estimativas, seus erros padrão e intervalosde confiança de 95%. O padrão de faltas foi do tipo multivariado arbitrário e, a matéria orgânica foi a variável com a maiorquantidade de dados faltantes. A significância das covariáveis variou de acordo com a variável a ser estimada. Os resultadosmostraram que o MICE apresentou melhor desempenho que a ACC, pois, embora a comparação estatística dos dois métodostenha sido semelhante, a imputação múltipla mantém o tamanho do banco de dados e preserva a distribuição geral
id EMBR_5e50b2f1d49e0dbb76fd7644206479f8
oai_identifier_str oai:www.alice.cnptia.embrapa.br:doc/1130368
network_acronym_str EMBR
network_name_str Repositório Institucional da EMBRAPA (Repository Open Access to Scientific Information from EMBRAPA - Alice)
repository_id_str 2154
spelling Multiple imputation to fill in missing data in soil physico-hydricalproperties database.Propriedades físico-hídricasPreditores de faltaDados incompletosMonte Carlo via Cadeias de MarkovBase de DadosSoloValores faltantes em banco de dados é um problema comum e quase inevitável. A imputação múltipla (IM) é ummétodo estatístico eficiente para estimar valores ausentes em um conjunto de dados incompleto. Para testar essa abordagemem um banco de dados de solo, hipotetizamos que a imputação de dados ausentes fornece um banco de dados estatisticamentemais preciso do que a análise de casos completos (ACC). O objetivo geral do estudo foi avaliar a eficiência da IM usando oalgoritmo MICE (Imputação Multivariada por Equações Encadeadas) para preencher dados ausentes em um banco de dadosde propriedades físico-hídricas do solo e mostrar que é mais viável realizar a imputação do que a ACC. Análise preliminar dobanco de dados foi realizada para verificar a adequação do algoritmo proposto. A imputação dos dados faltantes de cada variávelfoi ajustada usando modelos de regressão linear. Variáveis com dados faltantes entram no modelo como variável dependente eas outras como covariáveis. As análises foram realizadas comparando os valores das estimativas, seus erros padrão e intervalosde confiança de 95%. O padrão de faltas foi do tipo multivariado arbitrário e, a matéria orgânica foi a variável com a maiorquantidade de dados faltantes. A significância das covariáveis variou de acordo com a variável a ser estimada. Os resultadosmostraram que o MICE apresentou melhor desempenho que a ACC, pois, embora a comparação estatística dos dois métodostenha sido semelhante, a imputação múltipla mantém o tamanho do banco de dados e preserva a distribuição geralLuciana Maria de Oliveira, UFRA; Herdjania Veras de Lima, UFRA; Sueli Rodrigues, UFPI; EDUARDO JORGE MAKLOUF CARVALHO, CPATU; Lorena Chagas Torres, UFRA.OLIVEIRA, L. M. deLIMA, H. V. deRODRIGUES, S.CARVALHO, E. J. M.TORRES, L. C.2021-03-01T12:01:28Z2021-03-01T12:01:28Z2021-03-012020info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/articleRevista Ciência Agronômica, v. 51, n. 4, e20196817, 2020.http://www.alice.cnptia.embrapa.br/alice/handle/doc/113036810.5935/1806-6690.20200079enginfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da EMBRAPA (Repository Open Access to Scientific Information from EMBRAPA - Alice)instname:Empresa Brasileira de Pesquisa Agropecuária (Embrapa)instacron:EMBRAPA2021-03-01T12:01:38Zoai:www.alice.cnptia.embrapa.br:doc/1130368Repositório InstitucionalPUBhttps://www.alice.cnptia.embrapa.br/oai/requestopendoar:21542021-03-01T12:01:38falseRepositório InstitucionalPUBhttps://www.alice.cnptia.embrapa.br/oai/requestcg-riaa@embrapa.bropendoar:21542021-03-01T12:01:38Repositório Institucional da EMBRAPA (Repository Open Access to Scientific Information from EMBRAPA - Alice) - Empresa Brasileira de Pesquisa Agropecuária (Embrapa)false
dc.title.none.fl_str_mv Multiple imputation to fill in missing data in soil physico-hydricalproperties database.
title Multiple imputation to fill in missing data in soil physico-hydricalproperties database.
spellingShingle Multiple imputation to fill in missing data in soil physico-hydricalproperties database.
OLIVEIRA, L. M. de
Propriedades físico-hídricas
Preditores de falta
Dados incompletos
Monte Carlo via Cadeias de Markov
Base de Dados
Solo
title_short Multiple imputation to fill in missing data in soil physico-hydricalproperties database.
title_full Multiple imputation to fill in missing data in soil physico-hydricalproperties database.
title_fullStr Multiple imputation to fill in missing data in soil physico-hydricalproperties database.
title_full_unstemmed Multiple imputation to fill in missing data in soil physico-hydricalproperties database.
title_sort Multiple imputation to fill in missing data in soil physico-hydricalproperties database.
author OLIVEIRA, L. M. de
author_facet OLIVEIRA, L. M. de
LIMA, H. V. de
RODRIGUES, S.
CARVALHO, E. J. M.
TORRES, L. C.
author_role author
author2 LIMA, H. V. de
RODRIGUES, S.
CARVALHO, E. J. M.
TORRES, L. C.
author2_role author
author
author
author
dc.contributor.none.fl_str_mv Luciana Maria de Oliveira, UFRA; Herdjania Veras de Lima, UFRA; Sueli Rodrigues, UFPI; EDUARDO JORGE MAKLOUF CARVALHO, CPATU; Lorena Chagas Torres, UFRA.
dc.contributor.author.fl_str_mv OLIVEIRA, L. M. de
LIMA, H. V. de
RODRIGUES, S.
CARVALHO, E. J. M.
TORRES, L. C.
dc.subject.por.fl_str_mv Propriedades físico-hídricas
Preditores de falta
Dados incompletos
Monte Carlo via Cadeias de Markov
Base de Dados
Solo
topic Propriedades físico-hídricas
Preditores de falta
Dados incompletos
Monte Carlo via Cadeias de Markov
Base de Dados
Solo
description Valores faltantes em banco de dados é um problema comum e quase inevitável. A imputação múltipla (IM) é ummétodo estatístico eficiente para estimar valores ausentes em um conjunto de dados incompleto. Para testar essa abordagemem um banco de dados de solo, hipotetizamos que a imputação de dados ausentes fornece um banco de dados estatisticamentemais preciso do que a análise de casos completos (ACC). O objetivo geral do estudo foi avaliar a eficiência da IM usando oalgoritmo MICE (Imputação Multivariada por Equações Encadeadas) para preencher dados ausentes em um banco de dadosde propriedades físico-hídricas do solo e mostrar que é mais viável realizar a imputação do que a ACC. Análise preliminar dobanco de dados foi realizada para verificar a adequação do algoritmo proposto. A imputação dos dados faltantes de cada variávelfoi ajustada usando modelos de regressão linear. Variáveis com dados faltantes entram no modelo como variável dependente eas outras como covariáveis. As análises foram realizadas comparando os valores das estimativas, seus erros padrão e intervalosde confiança de 95%. O padrão de faltas foi do tipo multivariado arbitrário e, a matéria orgânica foi a variável com a maiorquantidade de dados faltantes. A significância das covariáveis variou de acordo com a variável a ser estimada. Os resultadosmostraram que o MICE apresentou melhor desempenho que a ACC, pois, embora a comparação estatística dos dois métodostenha sido semelhante, a imputação múltipla mantém o tamanho do banco de dados e preserva a distribuição geral
publishDate 2020
dc.date.none.fl_str_mv 2020
2021-03-01T12:01:28Z
2021-03-01T12:01:28Z
2021-03-01
dc.type.driver.fl_str_mv info:eu-repo/semantics/publishedVersion
info:eu-repo/semantics/article
format article
status_str publishedVersion
dc.identifier.uri.fl_str_mv Revista Ciência Agronômica, v. 51, n. 4, e20196817, 2020.
http://www.alice.cnptia.embrapa.br/alice/handle/doc/1130368
10.5935/1806-6690.20200079
identifier_str_mv Revista Ciência Agronômica, v. 51, n. 4, e20196817, 2020.
10.5935/1806-6690.20200079
url http://www.alice.cnptia.embrapa.br/alice/handle/doc/1130368
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.source.none.fl_str_mv reponame:Repositório Institucional da EMBRAPA (Repository Open Access to Scientific Information from EMBRAPA - Alice)
instname:Empresa Brasileira de Pesquisa Agropecuária (Embrapa)
instacron:EMBRAPA
instname_str Empresa Brasileira de Pesquisa Agropecuária (Embrapa)
instacron_str EMBRAPA
institution EMBRAPA
reponame_str Repositório Institucional da EMBRAPA (Repository Open Access to Scientific Information from EMBRAPA - Alice)
collection Repositório Institucional da EMBRAPA (Repository Open Access to Scientific Information from EMBRAPA - Alice)
repository.name.fl_str_mv Repositório Institucional da EMBRAPA (Repository Open Access to Scientific Information from EMBRAPA - Alice) - Empresa Brasileira de Pesquisa Agropecuária (Embrapa)
repository.mail.fl_str_mv cg-riaa@embrapa.br
_version_ 1794503503309176832