Uso da imputação múltipla de dados faltantes: uma simulação utilizando dados epidemiológicos

Detalhes bibliográficos
Autor(a) principal: Nunes, Luciana Neves
Data de Publicação: 2009
Outros Autores: Klück, Mariza Machado, Fachel, Jandyra Maria Guimarães
Tipo de documento: Artigo
Idioma: por
Título da fonte: Cadernos de Saúde Pública
Texto Completo: https://cadernos.ensp.fiocruz.br/ojs/index.php/csp/article/view/3938
Resumo: In situations with missing data, statistical analyses are usually limited to subjects with complete data. However, such estimates may be biased. The method of "filling in" missing data is called imputation. This article aimed to present a multiple imputation method. From a data set of 470 surgical patients, logistic models were developed for death as the outcome. Two incomplete data sets were generated: one with 5% and another with 20% of missing data in a single variable. Logistic models were fitted for the complete and incomplete data sets and for the data set completed by multiple imputations. Estimates obtained for the data set with missing data were different from those observed in the complete data set, mainly in the situation with 20% of missing data. The multiple imputation used here appeared efficient, producing very similar results to those obtained with the complete data set. However, one coefficient became non-significant. The analysis using multiple imputations was considered superior to using the data sets that excluded incomplete cases from the analysis.
id FIOCRUZ-5_761ac5c8f31c5f12c5e8bf92059ee3b3
oai_identifier_str oai:ojs.teste-cadernos.ensp.fiocruz.br:article/3938
network_acronym_str FIOCRUZ-5
network_name_str Cadernos de Saúde Pública
repository_id_str
spelling Uso da imputação múltipla de dados faltantes: uma simulação utilizando dados epidemiológicosInterpretação Estatística de DadosModelos EstatísticosBase de DadosIn situations with missing data, statistical analyses are usually limited to subjects with complete data. However, such estimates may be biased. The method of "filling in" missing data is called imputation. This article aimed to present a multiple imputation method. From a data set of 470 surgical patients, logistic models were developed for death as the outcome. Two incomplete data sets were generated: one with 5% and another with 20% of missing data in a single variable. Logistic models were fitted for the complete and incomplete data sets and for the data set completed by multiple imputations. Estimates obtained for the data set with missing data were different from those observed in the complete data set, mainly in the situation with 20% of missing data. The multiple imputation used here appeared efficient, producing very similar results to those obtained with the complete data set. However, one coefficient became non-significant. The analysis using multiple imputations was considered superior to using the data sets that excluded incomplete cases from the analysis.Em situações com dados faltantes, é comum restringir-se à análise dos sujeitos com dados completos. Porém, as estimativas com apenas esses sujeitos podem tornar-se viesadas. A prática de preenchimento de dados faltantes é a chamada técnica de imputação. Este trabalho tem como objetivo divulgar o método de imputação múltipla. Em um conjunto de dados de 470 pacientes cirúrgicos, foram ajustados modelos logísticos para o desfecho óbito. Foram gerados dois conjuntos de dados incompletos: um com 5% e outro com 20% de dados faltantes para uma variável. Foram ajustados modelos para o conjunto completo, com dados faltantes e para o conjunto completado por imputação múltipla. As estimativas obtidas pela análise dos conjuntos com dados faltantes e com o conjunto completo foram diferentes, principalmente as do conjunto com 20% de dados faltantes. A imputação múltipla utilizada pareceu eficiente, pois os resultados conseguidos com o banco completado por imputações foram próximos dos obtidos com o conjunto completo. Porém, um coeficiente deixou de ser estatisticamente significativo. A imputação múltipla se mostrou superior à análise do conjunto com dados faltantes, que desconsiderou os casos incompletos.Reports in Public HealthCadernos de Saúde Pública2009-02-01info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersiontext/htmlapplication/pdfhttps://cadernos.ensp.fiocruz.br/ojs/index.php/csp/article/view/3938Reports in Public Health; Vol. 25 No. 2 (2009): FebruaryCadernos de Saúde Pública; v. 25 n. 2 (2009): Fevereiro1678-44640102-311Xreponame:Cadernos de Saúde Públicainstname:Fundação Oswaldo Cruz (FIOCRUZ)instacron:FIOCRUZporhttps://cadernos.ensp.fiocruz.br/ojs/index.php/csp/article/view/3938/7997https://cadernos.ensp.fiocruz.br/ojs/index.php/csp/article/view/3938/7998Nunes, Luciana NevesKlück, Mariza MachadoFachel, Jandyra Maria Guimarãesinfo:eu-repo/semantics/openAccess2024-03-06T15:27:54Zoai:ojs.teste-cadernos.ensp.fiocruz.br:article/3938Revistahttps://cadernos.ensp.fiocruz.br/ojs/index.php/csphttps://cadernos.ensp.fiocruz.br/ojs/index.php/csp/oaicadernos@ensp.fiocruz.br||cadernos@ensp.fiocruz.br1678-44640102-311Xopendoar:2024-03-06T13:04:31.364848Cadernos de Saúde Pública - Fundação Oswaldo Cruz (FIOCRUZ)true
dc.title.none.fl_str_mv Uso da imputação múltipla de dados faltantes: uma simulação utilizando dados epidemiológicos
title Uso da imputação múltipla de dados faltantes: uma simulação utilizando dados epidemiológicos
spellingShingle Uso da imputação múltipla de dados faltantes: uma simulação utilizando dados epidemiológicos
Nunes, Luciana Neves
Interpretação Estatística de Dados
Modelos Estatísticos
Base de Dados
title_short Uso da imputação múltipla de dados faltantes: uma simulação utilizando dados epidemiológicos
title_full Uso da imputação múltipla de dados faltantes: uma simulação utilizando dados epidemiológicos
title_fullStr Uso da imputação múltipla de dados faltantes: uma simulação utilizando dados epidemiológicos
title_full_unstemmed Uso da imputação múltipla de dados faltantes: uma simulação utilizando dados epidemiológicos
title_sort Uso da imputação múltipla de dados faltantes: uma simulação utilizando dados epidemiológicos
author Nunes, Luciana Neves
author_facet Nunes, Luciana Neves
Klück, Mariza Machado
Fachel, Jandyra Maria Guimarães
author_role author
author2 Klück, Mariza Machado
Fachel, Jandyra Maria Guimarães
author2_role author
author
dc.contributor.author.fl_str_mv Nunes, Luciana Neves
Klück, Mariza Machado
Fachel, Jandyra Maria Guimarães
dc.subject.por.fl_str_mv Interpretação Estatística de Dados
Modelos Estatísticos
Base de Dados
topic Interpretação Estatística de Dados
Modelos Estatísticos
Base de Dados
description In situations with missing data, statistical analyses are usually limited to subjects with complete data. However, such estimates may be biased. The method of "filling in" missing data is called imputation. This article aimed to present a multiple imputation method. From a data set of 470 surgical patients, logistic models were developed for death as the outcome. Two incomplete data sets were generated: one with 5% and another with 20% of missing data in a single variable. Logistic models were fitted for the complete and incomplete data sets and for the data set completed by multiple imputations. Estimates obtained for the data set with missing data were different from those observed in the complete data set, mainly in the situation with 20% of missing data. The multiple imputation used here appeared efficient, producing very similar results to those obtained with the complete data set. However, one coefficient became non-significant. The analysis using multiple imputations was considered superior to using the data sets that excluded incomplete cases from the analysis.
publishDate 2009
dc.date.none.fl_str_mv 2009-02-01
dc.type.driver.fl_str_mv info:eu-repo/semantics/article
info:eu-repo/semantics/publishedVersion
format article
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://cadernos.ensp.fiocruz.br/ojs/index.php/csp/article/view/3938
url https://cadernos.ensp.fiocruz.br/ojs/index.php/csp/article/view/3938
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv https://cadernos.ensp.fiocruz.br/ojs/index.php/csp/article/view/3938/7997
https://cadernos.ensp.fiocruz.br/ojs/index.php/csp/article/view/3938/7998
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv text/html
application/pdf
dc.publisher.none.fl_str_mv Reports in Public Health
Cadernos de Saúde Pública
publisher.none.fl_str_mv Reports in Public Health
Cadernos de Saúde Pública
dc.source.none.fl_str_mv Reports in Public Health; Vol. 25 No. 2 (2009): February
Cadernos de Saúde Pública; v. 25 n. 2 (2009): Fevereiro
1678-4464
0102-311X
reponame:Cadernos de Saúde Pública
instname:Fundação Oswaldo Cruz (FIOCRUZ)
instacron:FIOCRUZ
instname_str Fundação Oswaldo Cruz (FIOCRUZ)
instacron_str FIOCRUZ
institution FIOCRUZ
reponame_str Cadernos de Saúde Pública
collection Cadernos de Saúde Pública
repository.name.fl_str_mv Cadernos de Saúde Pública - Fundação Oswaldo Cruz (FIOCRUZ)
repository.mail.fl_str_mv cadernos@ensp.fiocruz.br||cadernos@ensp.fiocruz.br
_version_ 1798943364876337152