Missing data in educational assessment: a comparison of data treatment methods

Detalhes bibliográficos
Autor(a) principal: Vinha, Luis Gustavo do Amaral
Data de Publicação: 2018
Outros Autores: Laros, Jacob Arie
Tipo de documento: Artigo
Idioma: por
Título da fonte: Estudos em Avaliação Educacional
Texto Completo: https://publicacoes.fcc.org.br/eae/article/view/3916
Resumo: Missing data are common in educational assessments. Using the appropriate methods has, therefore, become essential to reduce the impact of the loss of information. The present study aims to compare the performance of four methods for dealing with missing data (mean imputation, listwise deletion, maximum likelihood and multiple imputation), all based on regression models applied to the educational assessment of data collected in the State of Ceará. Information about 7,000 students was used, simulating various scenarios according to the percentage and the type of the missing data. The mean imputation method showed the worst performance in all simulated scenarios and the other methods showed similar results among themselves. Moreover, the use of auxiliary variables in the estimation by maximum likelihood and multiple imputation proved to reduce the bias of estimates of some important parameters of the model, when the simulated missing data is not random.
id FCC-2_3a48adc2f1eb5e5f3718c0fe5d485677
oai_identifier_str oai:ojs.publicacoes.fcc.org.br:article/3916
network_acronym_str FCC-2
network_name_str Estudos em Avaliação Educacional
repository_id_str
spelling Missing data in educational assessment: a comparison of data treatment methodsDatos ausentes en evaluaciones educacionales: comparación de métodos de tratamientoDados ausentes em avaliações educacionais: comparação de métodos de tratamentoTreatment of Missing DataEducation AssessmentAcademic PerformanceSimulation.Tratamiento de Datos AusentesEvaluación de la EducaciónDesempeño AcadémicoSimulación.Tratamento de Dados AusentesAvaliação da EducaçãoDesempenho AcadêmicoSimulação.Métodos para avaliações educacionaisMissing data are common in educational assessments. Using the appropriate methods has, therefore, become essential to reduce the impact of the loss of information. The present study aims to compare the performance of four methods for dealing with missing data (mean imputation, listwise deletion, maximum likelihood and multiple imputation), all based on regression models applied to the educational assessment of data collected in the State of Ceará. Information about 7,000 students was used, simulating various scenarios according to the percentage and the type of the missing data. The mean imputation method showed the worst performance in all simulated scenarios and the other methods showed similar results among themselves. Moreover, the use of auxiliary variables in the estimation by maximum likelihood and multiple imputation proved to reduce the bias of estimates of some important parameters of the model, when the simulated missing data is not random.Los datos ausentes son comunes en las evaluaciones educacionales. Por ello el uso de métodos adecuados se hace fundamental para reducir el impacto de la pérdida de información. El objetivo de este estudio es comparar el desempeño de cuatro métodos de tratamientos de datos ausentes (imputación por el promedio, listwise deletion, máxima verosimilitud e imputación múltiple), en base al uso de modelos de regresión aplicados a los datos de la evaluación educacional realizada en el estado de Ceará. Se utilizaron informaciones de 7.000 estudiantes, simulando diversos escenarios de acuerdo al porcentual y al tipo de ausencia. La imputación por el promedio presentó el peor desempeño en todos los escenarios simulados y los demás métodos mostraron resultados similares entre ellos. También se verificó que el uso de variables auxiliares en la estimación por máxima verosimilitud e imputación múltiple redujo el sesgo de las estimaciones de parámetros importantes del modelo cuando la ausencia simulada no se debe a la casualidad.Os dados ausentes são comuns nas avaliações educacionais. Por isso, o uso de métodos adequados torna-se fundamental para reduzir o impacto da perda de informação. O objetivo deste estudo é comparar o desempenho de quatro métodos de tratamentos de dados ausentes (imputação pela média, listwise deletion, máxima verossimilhança e imputação múltipla), tendo como base o uso de modelos de regressão aplicados aos dados da avaliação educacional realizada no estado do Ceará. Foram utilizadas informações de 7.000 estudantes, simulando-se diversos cenários de acordo com o percentual e o tipo de ausência. A imputação pela média apresentou o pior desempenho em todos os cenários simulados e os demais métodos mostraram resultados semelhantes entre si. Verificou-se ainda que o uso de variáveis auxiliares na estimação por máxima verossimilhança e imputação múltipla reduziu o viés das estimativas de parâmetros importantes do modelo quando a ausência simulada não é ao acaso.Fundação Carlos Chagas2018-04-23info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionapplication/pdfhttps://publicacoes.fcc.org.br/eae/article/view/391610.18222/eae.v0ix.3916Estudos em Avaliação Educacional; Vol. 29 No. 70 (2018): jan./abr. 2018; 156-187Estudos em Avaliação Educacional; Vol. 29 Núm. 70 (2018): jan./abr. 2018; 156-187Estudos em Avaliação Educacional; Vol. 29 No. 70 (2018): jan./abr. 2018; 156-187Estudos em Avaliação Educacional; V. 29 N. 70 (2018): jan./abr. 2018; 156-187Estudos em Avaliação Educacional; v. 29 n. 70 (2018): jan./abr. 2018; 156-1871984-932X0103-6831reponame:Estudos em Avaliação Educacionalinstname:Fundação Carlos Chagas (FCC)instacron:FCCporhttps://publicacoes.fcc.org.br/eae/article/view/3916/3560Copyright (c) 2018 Estudos em Avaliação Educacionalhttps://creativecommons.org/licenses/by-nc/4.0info:eu-repo/semantics/openAccessVinha, Luis Gustavo do AmaralLaros, Jacob Arie2024-01-23T12:31:29Zoai:ojs.publicacoes.fcc.org.br:article/3916Revistahttp://publicacoes.fcc.org.br/ojs/index.php/eae/indexONGhttp://publicacoes.fcc.org.br/ojs/index.php/eae/oaieae@fcc.org.br||ngimenes@fcc.org.br1984-932X0103-6831opendoar:2024-01-23T12:31:29Estudos em Avaliação Educacional - Fundação Carlos Chagas (FCC)false
dc.title.none.fl_str_mv Missing data in educational assessment: a comparison of data treatment methods
Datos ausentes en evaluaciones educacionales: comparación de métodos de tratamiento
Dados ausentes em avaliações educacionais: comparação de métodos de tratamento
title Missing data in educational assessment: a comparison of data treatment methods
spellingShingle Missing data in educational assessment: a comparison of data treatment methods
Vinha, Luis Gustavo do Amaral
Treatment of Missing Data
Education Assessment
Academic Performance
Simulation.
Tratamiento de Datos Ausentes
Evaluación de la Educación
Desempeño Académico
Simulación.
Tratamento de Dados Ausentes
Avaliação da Educação
Desempenho Acadêmico
Simulação.
Métodos para avaliações educacionais
title_short Missing data in educational assessment: a comparison of data treatment methods
title_full Missing data in educational assessment: a comparison of data treatment methods
title_fullStr Missing data in educational assessment: a comparison of data treatment methods
title_full_unstemmed Missing data in educational assessment: a comparison of data treatment methods
title_sort Missing data in educational assessment: a comparison of data treatment methods
author Vinha, Luis Gustavo do Amaral
author_facet Vinha, Luis Gustavo do Amaral
Laros, Jacob Arie
author_role author
author2 Laros, Jacob Arie
author2_role author
dc.contributor.author.fl_str_mv Vinha, Luis Gustavo do Amaral
Laros, Jacob Arie
dc.subject.por.fl_str_mv Treatment of Missing Data
Education Assessment
Academic Performance
Simulation.
Tratamiento de Datos Ausentes
Evaluación de la Educación
Desempeño Académico
Simulación.
Tratamento de Dados Ausentes
Avaliação da Educação
Desempenho Acadêmico
Simulação.
Métodos para avaliações educacionais
topic Treatment of Missing Data
Education Assessment
Academic Performance
Simulation.
Tratamiento de Datos Ausentes
Evaluación de la Educación
Desempeño Académico
Simulación.
Tratamento de Dados Ausentes
Avaliação da Educação
Desempenho Acadêmico
Simulação.
Métodos para avaliações educacionais
description Missing data are common in educational assessments. Using the appropriate methods has, therefore, become essential to reduce the impact of the loss of information. The present study aims to compare the performance of four methods for dealing with missing data (mean imputation, listwise deletion, maximum likelihood and multiple imputation), all based on regression models applied to the educational assessment of data collected in the State of Ceará. Information about 7,000 students was used, simulating various scenarios according to the percentage and the type of the missing data. The mean imputation method showed the worst performance in all simulated scenarios and the other methods showed similar results among themselves. Moreover, the use of auxiliary variables in the estimation by maximum likelihood and multiple imputation proved to reduce the bias of estimates of some important parameters of the model, when the simulated missing data is not random.
publishDate 2018
dc.date.none.fl_str_mv 2018-04-23
dc.type.driver.fl_str_mv info:eu-repo/semantics/article
info:eu-repo/semantics/publishedVersion
format article
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://publicacoes.fcc.org.br/eae/article/view/3916
10.18222/eae.v0ix.3916
url https://publicacoes.fcc.org.br/eae/article/view/3916
identifier_str_mv 10.18222/eae.v0ix.3916
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv https://publicacoes.fcc.org.br/eae/article/view/3916/3560
dc.rights.driver.fl_str_mv Copyright (c) 2018 Estudos em Avaliação Educacional
https://creativecommons.org/licenses/by-nc/4.0
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Copyright (c) 2018 Estudos em Avaliação Educacional
https://creativecommons.org/licenses/by-nc/4.0
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Fundação Carlos Chagas
publisher.none.fl_str_mv Fundação Carlos Chagas
dc.source.none.fl_str_mv Estudos em Avaliação Educacional; Vol. 29 No. 70 (2018): jan./abr. 2018; 156-187
Estudos em Avaliação Educacional; Vol. 29 Núm. 70 (2018): jan./abr. 2018; 156-187
Estudos em Avaliação Educacional; Vol. 29 No. 70 (2018): jan./abr. 2018; 156-187
Estudos em Avaliação Educacional; V. 29 N. 70 (2018): jan./abr. 2018; 156-187
Estudos em Avaliação Educacional; v. 29 n. 70 (2018): jan./abr. 2018; 156-187
1984-932X
0103-6831
reponame:Estudos em Avaliação Educacional
instname:Fundação Carlos Chagas (FCC)
instacron:FCC
instname_str Fundação Carlos Chagas (FCC)
instacron_str FCC
institution FCC
reponame_str Estudos em Avaliação Educacional
collection Estudos em Avaliação Educacional
repository.name.fl_str_mv Estudos em Avaliação Educacional - Fundação Carlos Chagas (FCC)
repository.mail.fl_str_mv eae@fcc.org.br||ngimenes@fcc.org.br
_version_ 1795332422426951680