Utilização do sucesso acadêmico para prever o abandono escolar de estudantes do ensino superior: um caso de estudo

Detalhes bibliográficos
Autor(a) principal: Sousa, António Carlos Corte-Real de
Data de Publicação: 2019
Outros Autores: Oliveira, Carlos Alberto Bragança de, Borges, José Luís Cabral Moura
Tipo de documento: Artigo
Idioma: eng
por
Título da fonte: Educação e Pesquisa
Texto Completo: https://www.revistas.usp.br/ep/article/view/157515
Resumo: O abandono escolar é um problema complexo que afeta a maioria dos programas de graduação pós-secundária, em todo o mundo. O curso de engenharia industrial do Instituto ISVOUGA, localizado em Santa Maria da Feira, Portugal, não é exceção. Este estudo usou um conjunto de dados contendo informações gerais dos estudantes e suas notas para as unidades curriculares já avaliadas. A partir deste conjunto de dados, foram selecionados dezessete preditores potenciais: cinco intrínsecos (gênero, estado civil, situação profissional, idade e regime de dedicação aos estudos – integral ou parcial) e doze extrínsecos (as notas em todas as doze unidades curriculares ministradas durante os dois primeiros semestres do curso). O objetivo principal desta investigação foi prever a probabilidade de um estudante abandonar o curso com base nos referidos preditores. Foi usada uma regressão logística binária para classificar os estudantes como tendo uma probabilidade alta ou baixa de não se reinscreverem no curso. Para validar se a metodologia utilizada é apropriada para o estudo em causa, a precisão obtida com o modelo de regressão logística foi comparada, por via de uma validação cruzada com cinco partições, com a precisão obtida pela utilização de três métodos muito utilizados em data mining: One R, K Nearest Neighbors e Naive Bayes. O modelo de regressão logística identificou quatro variáveis significativas na previsão do abandono escolar (as classificações nas unidades curriculares de ciência dos materiais, eletricidade, cálculo 1 e química). Os dois preditores mais influentes do abandono dos estudantes são não conseguir aprovação nas unidades curriculares menos exigentes: ciência dos materiais e eletricidade. Ao contrário do que seria de supor antes desta investigação, descobrimos que a não aprovação em unidades curriculares mais exigentes, como física ou estatística, não tem influência significativa no abandono escolar.
id USP-11_449a011976ba83661658a6ce2a411260
oai_identifier_str oai:revistas.usp.br:article/157515
network_acronym_str USP-11
network_name_str Educação e Pesquisa
repository_id_str
spelling Utilização do sucesso acadêmico para prever o abandono escolar de estudantes do ensino superior: um caso de estudoUsing Academic Performance to Predict College Students Dropout: a case studyStudent dropoutRetentionLogistic regressionData miningAbandono escolarRetençãoRegressão logísticaData miningO abandono escolar é um problema complexo que afeta a maioria dos programas de graduação pós-secundária, em todo o mundo. O curso de engenharia industrial do Instituto ISVOUGA, localizado em Santa Maria da Feira, Portugal, não é exceção. Este estudo usou um conjunto de dados contendo informações gerais dos estudantes e suas notas para as unidades curriculares já avaliadas. A partir deste conjunto de dados, foram selecionados dezessete preditores potenciais: cinco intrínsecos (gênero, estado civil, situação profissional, idade e regime de dedicação aos estudos – integral ou parcial) e doze extrínsecos (as notas em todas as doze unidades curriculares ministradas durante os dois primeiros semestres do curso). O objetivo principal desta investigação foi prever a probabilidade de um estudante abandonar o curso com base nos referidos preditores. Foi usada uma regressão logística binária para classificar os estudantes como tendo uma probabilidade alta ou baixa de não se reinscreverem no curso. Para validar se a metodologia utilizada é apropriada para o estudo em causa, a precisão obtida com o modelo de regressão logística foi comparada, por via de uma validação cruzada com cinco partições, com a precisão obtida pela utilização de três métodos muito utilizados em data mining: One R, K Nearest Neighbors e Naive Bayes. O modelo de regressão logística identificou quatro variáveis significativas na previsão do abandono escolar (as classificações nas unidades curriculares de ciência dos materiais, eletricidade, cálculo 1 e química). Os dois preditores mais influentes do abandono dos estudantes são não conseguir aprovação nas unidades curriculares menos exigentes: ciência dos materiais e eletricidade. Ao contrário do que seria de supor antes desta investigação, descobrimos que a não aprovação em unidades curriculares mais exigentes, como física ou estatística, não tem influência significativa no abandono escolar.Student dropout is a complex problem that affects most post-secondary undergraduate programs, all over the world. The Industrial Engineering program of the ISVOUGA Institute, located in Sta. Maria da Feira, Portugal, is no exception. This research used a dataset containing students’ general information and the students’ marks for the already assessed courses. From this dataset, 17 potential predictors have been selected: five intrinsic predictors (gender, marital status, professional status, full/part time student, and age) and 12 extrinsic ones (the marks in all the 12 courses taught during the first two semesters of the program). The main goal of this research was to predict the likelihood of a student to dropout, based on the referred predictors. A binary logistic regression was used to classify students as having a high or low probability not to re enroll the program. To validate the appropriateness of the used methodology, the accuracy of the logistic model was compared, by means of a 5-fold cross-validation, to the accuracy of three classification methods commonly used in Data Mining: One R, K Nearest Neighbors, and Naive Bayes. Four variables were significant to the logistic model (the marks in Materials Science, Electricity, Calculus 1, and Chemistry). The two most influential predictors for student dropout are failing to pass in the less challenging courses of Materials Science and Electricity. Contrary to what we would think prior to this research, we found that failing in more challenging courses such as Physics or Statistics does not have a significant influence on student dropout.Universidade de São Paulo. Faculdade de Educação2019-04-29info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionapplication/pdfapplication/pdfhttps://www.revistas.usp.br/ep/article/view/15751510.1590/s1678-4634201844180590Educação e Pesquisa; v. 44 (2018); e180590Educação e Pesquisa; Vol. 44 (2018); e180590Educação e Pesquisa; Vol. 44 (2018); e1805901678-46341517-9702reponame:Educação e Pesquisainstname:Universidade de São Paulo (USP)instacron:USPengporhttps://www.revistas.usp.br/ep/article/view/157515/152850https://www.revistas.usp.br/ep/article/view/157515/152851Copyright (c) 2019 Educação e Pesquisainfo:eu-repo/semantics/openAccessSousa, António Carlos Corte-Real deOliveira, Carlos Alberto Bragança deBorges, José Luís Cabral Moura2019-04-29T17:01:04Zoai:revistas.usp.br:article/157515Revistahttps://www.revistas.usp.br/ep/indexPUBhttps://www.revistas.usp.br/ep/oai||revedu@usp.br1678-46341517-9702opendoar:2019-04-29T17:01:04Educação e Pesquisa - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Utilização do sucesso acadêmico para prever o abandono escolar de estudantes do ensino superior: um caso de estudo
Using Academic Performance to Predict College Students Dropout: a case study
title Utilização do sucesso acadêmico para prever o abandono escolar de estudantes do ensino superior: um caso de estudo
spellingShingle Utilização do sucesso acadêmico para prever o abandono escolar de estudantes do ensino superior: um caso de estudo
Sousa, António Carlos Corte-Real de
Student dropout
Retention
Logistic regression
Data mining
Abandono escolar
Retenção
Regressão logística
Data mining
title_short Utilização do sucesso acadêmico para prever o abandono escolar de estudantes do ensino superior: um caso de estudo
title_full Utilização do sucesso acadêmico para prever o abandono escolar de estudantes do ensino superior: um caso de estudo
title_fullStr Utilização do sucesso acadêmico para prever o abandono escolar de estudantes do ensino superior: um caso de estudo
title_full_unstemmed Utilização do sucesso acadêmico para prever o abandono escolar de estudantes do ensino superior: um caso de estudo
title_sort Utilização do sucesso acadêmico para prever o abandono escolar de estudantes do ensino superior: um caso de estudo
author Sousa, António Carlos Corte-Real de
author_facet Sousa, António Carlos Corte-Real de
Oliveira, Carlos Alberto Bragança de
Borges, José Luís Cabral Moura
author_role author
author2 Oliveira, Carlos Alberto Bragança de
Borges, José Luís Cabral Moura
author2_role author
author
dc.contributor.author.fl_str_mv Sousa, António Carlos Corte-Real de
Oliveira, Carlos Alberto Bragança de
Borges, José Luís Cabral Moura
dc.subject.por.fl_str_mv Student dropout
Retention
Logistic regression
Data mining
Abandono escolar
Retenção
Regressão logística
Data mining
topic Student dropout
Retention
Logistic regression
Data mining
Abandono escolar
Retenção
Regressão logística
Data mining
description O abandono escolar é um problema complexo que afeta a maioria dos programas de graduação pós-secundária, em todo o mundo. O curso de engenharia industrial do Instituto ISVOUGA, localizado em Santa Maria da Feira, Portugal, não é exceção. Este estudo usou um conjunto de dados contendo informações gerais dos estudantes e suas notas para as unidades curriculares já avaliadas. A partir deste conjunto de dados, foram selecionados dezessete preditores potenciais: cinco intrínsecos (gênero, estado civil, situação profissional, idade e regime de dedicação aos estudos – integral ou parcial) e doze extrínsecos (as notas em todas as doze unidades curriculares ministradas durante os dois primeiros semestres do curso). O objetivo principal desta investigação foi prever a probabilidade de um estudante abandonar o curso com base nos referidos preditores. Foi usada uma regressão logística binária para classificar os estudantes como tendo uma probabilidade alta ou baixa de não se reinscreverem no curso. Para validar se a metodologia utilizada é apropriada para o estudo em causa, a precisão obtida com o modelo de regressão logística foi comparada, por via de uma validação cruzada com cinco partições, com a precisão obtida pela utilização de três métodos muito utilizados em data mining: One R, K Nearest Neighbors e Naive Bayes. O modelo de regressão logística identificou quatro variáveis significativas na previsão do abandono escolar (as classificações nas unidades curriculares de ciência dos materiais, eletricidade, cálculo 1 e química). Os dois preditores mais influentes do abandono dos estudantes são não conseguir aprovação nas unidades curriculares menos exigentes: ciência dos materiais e eletricidade. Ao contrário do que seria de supor antes desta investigação, descobrimos que a não aprovação em unidades curriculares mais exigentes, como física ou estatística, não tem influência significativa no abandono escolar.
publishDate 2019
dc.date.none.fl_str_mv 2019-04-29
dc.type.driver.fl_str_mv info:eu-repo/semantics/article
info:eu-repo/semantics/publishedVersion
format article
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.revistas.usp.br/ep/article/view/157515
10.1590/s1678-4634201844180590
url https://www.revistas.usp.br/ep/article/view/157515
identifier_str_mv 10.1590/s1678-4634201844180590
dc.language.iso.fl_str_mv eng
por
language eng
por
dc.relation.none.fl_str_mv https://www.revistas.usp.br/ep/article/view/157515/152850
https://www.revistas.usp.br/ep/article/view/157515/152851
dc.rights.driver.fl_str_mv Copyright (c) 2019 Educação e Pesquisa
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Copyright (c) 2019 Educação e Pesquisa
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
application/pdf
dc.publisher.none.fl_str_mv Universidade de São Paulo. Faculdade de Educação
publisher.none.fl_str_mv Universidade de São Paulo. Faculdade de Educação
dc.source.none.fl_str_mv Educação e Pesquisa; v. 44 (2018); e180590
Educação e Pesquisa; Vol. 44 (2018); e180590
Educação e Pesquisa; Vol. 44 (2018); e180590
1678-4634
1517-9702
reponame:Educação e Pesquisa
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Educação e Pesquisa
collection Educação e Pesquisa
repository.name.fl_str_mv Educação e Pesquisa - Universidade de São Paulo (USP)
repository.mail.fl_str_mv ||revedu@usp.br
_version_ 1787713809733910528