Previsão de evasão universitária com aprendizado de máquina

Detalhes bibliográficos
Autor(a) principal: MALERBA, Adriano
Data de Publicação: 2024
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UNIFEI (RIUNIFEI)
Texto Completo: https://repositorio.unifei.edu.br/jspui/handle/123456789/4072
Resumo: A evasão de alunos é um problema que afeta as instituições de ensino superior no mundo todo, tendo impactos negativos tanto para os alunos quanto para as instituições, sejam elas públicas ou privadas. É essencial, que as instituições tenham ferramentas que os auxiliem no controle da evasão, proporcionando aos gestores a compreensão das expectativas educacionais dos alunos que ingressam no ensino superior, a fim de aprimorar a compreensão desse fenômeno. Os estudos recentes sobre previsão de evasão universitária utilizando aprendizado de máquina representa um avanço significativo na área da educação. Ao empregar a Técnica de Validação Cruzada (K-Fold) juntamente com uma variedade de algoritmos de classificação, como árvores de decisão, regressão logística, floresta aletória e máquinas de vetores de suporte, entre outros. Este trabalho busca entender e antecipar os padrões de evasão entre os alunos. Essa abordagem não apenas identifica fatores de risco para a evasão, mas também fornece informações valiosas para instituições educacionais no desenvolvimento de estratégias proativas de retenção de alunos. Ao prever com precisão a probabilidade de um estudante abandonar seus estudos, as universidades podem intervir precocemente, oferecendo suporte personalizado e recursos adicionais para ajudar os alunos a superar desafios acadêmicos e pessoais.Para isso, em relação ao modelo de recuperação dos alunos as técnicas LogisticRegression, GradientBoosting e XG Boost obtiveram resultados semelhantes e promissores, acima de 90% para F1-Score de formando e F1-score de evasão próximo a 89%. Já para os casos de algoritmos interpretáveis, modelo para desligamento de Alunos, os melhores resultados foram para os modelos Random Forest e Decision Tree com valores de 91% para F1-Score de Formando, 84% para F1-score de evasão. Este trabalho representa uma contribuição significativa para a melhoria da qualidade e da eficácia dos programas educacionais, promovendo a retenção e o sucesso dos alunos universitários.
id UFEI_4eba63f109783deaa99742fe78c77a2b
oai_identifier_str oai:repositorio.unifei.edu.br:123456789/4072
network_acronym_str UFEI
network_name_str Repositório Institucional da UNIFEI (RIUNIFEI)
repository_id_str 7044
spelling 2024-04-262024-05-212024-05-21T13:04:42Z2024-05-21T13:04:42Zhttps://repositorio.unifei.edu.br/jspui/handle/123456789/4072A evasão de alunos é um problema que afeta as instituições de ensino superior no mundo todo, tendo impactos negativos tanto para os alunos quanto para as instituições, sejam elas públicas ou privadas. É essencial, que as instituições tenham ferramentas que os auxiliem no controle da evasão, proporcionando aos gestores a compreensão das expectativas educacionais dos alunos que ingressam no ensino superior, a fim de aprimorar a compreensão desse fenômeno. Os estudos recentes sobre previsão de evasão universitária utilizando aprendizado de máquina representa um avanço significativo na área da educação. Ao empregar a Técnica de Validação Cruzada (K-Fold) juntamente com uma variedade de algoritmos de classificação, como árvores de decisão, regressão logística, floresta aletória e máquinas de vetores de suporte, entre outros. Este trabalho busca entender e antecipar os padrões de evasão entre os alunos. Essa abordagem não apenas identifica fatores de risco para a evasão, mas também fornece informações valiosas para instituições educacionais no desenvolvimento de estratégias proativas de retenção de alunos. Ao prever com precisão a probabilidade de um estudante abandonar seus estudos, as universidades podem intervir precocemente, oferecendo suporte personalizado e recursos adicionais para ajudar os alunos a superar desafios acadêmicos e pessoais.Para isso, em relação ao modelo de recuperação dos alunos as técnicas LogisticRegression, GradientBoosting e XG Boost obtiveram resultados semelhantes e promissores, acima de 90% para F1-Score de formando e F1-score de evasão próximo a 89%. Já para os casos de algoritmos interpretáveis, modelo para desligamento de Alunos, os melhores resultados foram para os modelos Random Forest e Decision Tree com valores de 91% para F1-Score de Formando, 84% para F1-score de evasão. Este trabalho representa uma contribuição significativa para a melhoria da qualidade e da eficácia dos programas educacionais, promovendo a retenção e o sucesso dos alunos universitários.Student dropout is a problem that affects higher education institutions around the world, having negative impacts on both students and institutions, whether public or private. It is essential that institutions have tools that help them control evasion, providing managers with an understanding of the educational expectations of students entering higher education, in order to improve understanding of this phenomenon. Recent studies on university dropout prediction using machine learning represent a significant advance in the area of education. By employing the Cross-Validation Technique (K-Fold) along with a variety of classification algorithms such as decision trees, logistic regression, random forest, and support vector machines, among others. This work seeks to understand and anticipate dropout patterns among students. This approach not only identifies risk factors for dropout, but also provides valuable information for educational institutions in developing proactive student retention strategies. By accurately predicting the likelihood of a student dropping out of their studies, universities can intervene early, offering personalized support and additional resources to help students overcome academic and personal challenges. To achieve this, in relation to the student recovery model, LogisticRegression techniques , GradientBoosting and XG Boost obtained similar and promising results, above 90% for graduate F1-Score and dropout F1-score close to 89%. As for the cases of interpretable algorithms, model for student dismissal, the best results were for the Random Forest and Decision Tree models with values of 91% for Graduate F1-Score, 84% for dropout F1-score. This work represents a significant contribution to improving the quality and effectiveness of educational programs, promoting the retention and success of university students.porUniversidade Federal de ItajubáPrograma de Pós-Graduação: Mestrado - Ciência e Tecnologia da ComputaçãoUNIFEIBrasilIESTI - Instituto de Engenharia de Sistemas e Tecnologia da InformaçãoCNPQ::CIÊNCIAS EXATAS E DA TERRA::CIÊNCIA DA COMPUTAÇÃOEvasão de alunosAprendizado de máquinaPrevisãoSeleção de modelosPrevisão de evasão universitária com aprendizado de máquinainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisMORAES, Carlos Henrique Valério dehttp://lattes.cnpq.br/3460761031788198http://lattes.cnpq.br/4214028309978324MALERBA, AdrianoMALERBA, Adriano. Previsão de evasão universitária com aprendizado de máquina. 2024. 65 f. Dissertação (Mestrado em Ciência e Tecnologia da Computação.) – Universidade Federal de Itajubá, Itajubá, 2024.info:eu-repo/semantics/openAccessreponame:Repositório Institucional da UNIFEI (RIUNIFEI)instname:Universidade Federal de Itajubá (UNIFEI)instacron:UNIFEILICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repositorio.unifei.edu.br/jspui/bitstream/123456789/4072/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52ORIGINALDissertação_2024074.pdfDissertação_2024074.pdfapplication/pdf2427166https://repositorio.unifei.edu.br/jspui/bitstream/123456789/4072/1/Disserta%c3%a7%c3%a3o_2024074.pdf13f3000dbc691885854f8e12f86b620eMD51123456789/40722024-05-21 10:04:43.567oai:repositorio.unifei.edu.br:123456789/4072Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório InstitucionalPUBhttps://repositorio.unifei.edu.br/oai/requestrepositorio@unifei.edu.br || geraldocarlos@unifei.edu.bropendoar:70442024-05-21T13:04:43Repositório Institucional da UNIFEI (RIUNIFEI) - Universidade Federal de Itajubá (UNIFEI)false
dc.title.pt_BR.fl_str_mv Previsão de evasão universitária com aprendizado de máquina
title Previsão de evasão universitária com aprendizado de máquina
spellingShingle Previsão de evasão universitária com aprendizado de máquina
MALERBA, Adriano
CNPQ::CIÊNCIAS EXATAS E DA TERRA::CIÊNCIA DA COMPUTAÇÃO
Evasão de alunos
Aprendizado de máquina
Previsão
Seleção de modelos
title_short Previsão de evasão universitária com aprendizado de máquina
title_full Previsão de evasão universitária com aprendizado de máquina
title_fullStr Previsão de evasão universitária com aprendizado de máquina
title_full_unstemmed Previsão de evasão universitária com aprendizado de máquina
title_sort Previsão de evasão universitária com aprendizado de máquina
author MALERBA, Adriano
author_facet MALERBA, Adriano
author_role author
dc.contributor.advisor1.fl_str_mv MORAES, Carlos Henrique Valério de
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/3460761031788198
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/4214028309978324
dc.contributor.author.fl_str_mv MALERBA, Adriano
contributor_str_mv MORAES, Carlos Henrique Valério de
dc.subject.cnpq.fl_str_mv CNPQ::CIÊNCIAS EXATAS E DA TERRA::CIÊNCIA DA COMPUTAÇÃO
topic CNPQ::CIÊNCIAS EXATAS E DA TERRA::CIÊNCIA DA COMPUTAÇÃO
Evasão de alunos
Aprendizado de máquina
Previsão
Seleção de modelos
dc.subject.por.fl_str_mv Evasão de alunos
Aprendizado de máquina
Previsão
Seleção de modelos
description A evasão de alunos é um problema que afeta as instituições de ensino superior no mundo todo, tendo impactos negativos tanto para os alunos quanto para as instituições, sejam elas públicas ou privadas. É essencial, que as instituições tenham ferramentas que os auxiliem no controle da evasão, proporcionando aos gestores a compreensão das expectativas educacionais dos alunos que ingressam no ensino superior, a fim de aprimorar a compreensão desse fenômeno. Os estudos recentes sobre previsão de evasão universitária utilizando aprendizado de máquina representa um avanço significativo na área da educação. Ao empregar a Técnica de Validação Cruzada (K-Fold) juntamente com uma variedade de algoritmos de classificação, como árvores de decisão, regressão logística, floresta aletória e máquinas de vetores de suporte, entre outros. Este trabalho busca entender e antecipar os padrões de evasão entre os alunos. Essa abordagem não apenas identifica fatores de risco para a evasão, mas também fornece informações valiosas para instituições educacionais no desenvolvimento de estratégias proativas de retenção de alunos. Ao prever com precisão a probabilidade de um estudante abandonar seus estudos, as universidades podem intervir precocemente, oferecendo suporte personalizado e recursos adicionais para ajudar os alunos a superar desafios acadêmicos e pessoais.Para isso, em relação ao modelo de recuperação dos alunos as técnicas LogisticRegression, GradientBoosting e XG Boost obtiveram resultados semelhantes e promissores, acima de 90% para F1-Score de formando e F1-score de evasão próximo a 89%. Já para os casos de algoritmos interpretáveis, modelo para desligamento de Alunos, os melhores resultados foram para os modelos Random Forest e Decision Tree com valores de 91% para F1-Score de Formando, 84% para F1-score de evasão. Este trabalho representa uma contribuição significativa para a melhoria da qualidade e da eficácia dos programas educacionais, promovendo a retenção e o sucesso dos alunos universitários.
publishDate 2024
dc.date.issued.fl_str_mv 2024-04-26
dc.date.available.fl_str_mv 2024-05-21
2024-05-21T13:04:42Z
dc.date.accessioned.fl_str_mv 2024-05-21T13:04:42Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.unifei.edu.br/jspui/handle/123456789/4072
url https://repositorio.unifei.edu.br/jspui/handle/123456789/4072
dc.language.iso.fl_str_mv por
language por
dc.relation.references.pt_BR.fl_str_mv MALERBA, Adriano. Previsão de evasão universitária com aprendizado de máquina. 2024. 65 f. Dissertação (Mestrado em Ciência e Tecnologia da Computação.) – Universidade Federal de Itajubá, Itajubá, 2024.
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Itajubá
dc.publisher.program.fl_str_mv Programa de Pós-Graduação: Mestrado - Ciência e Tecnologia da Computação
dc.publisher.initials.fl_str_mv UNIFEI
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv IESTI - Instituto de Engenharia de Sistemas e Tecnologia da Informação
publisher.none.fl_str_mv Universidade Federal de Itajubá
dc.source.none.fl_str_mv reponame:Repositório Institucional da UNIFEI (RIUNIFEI)
instname:Universidade Federal de Itajubá (UNIFEI)
instacron:UNIFEI
instname_str Universidade Federal de Itajubá (UNIFEI)
instacron_str UNIFEI
institution UNIFEI
reponame_str Repositório Institucional da UNIFEI (RIUNIFEI)
collection Repositório Institucional da UNIFEI (RIUNIFEI)
bitstream.url.fl_str_mv https://repositorio.unifei.edu.br/jspui/bitstream/123456789/4072/2/license.txt
https://repositorio.unifei.edu.br/jspui/bitstream/123456789/4072/1/Disserta%c3%a7%c3%a3o_2024074.pdf
bitstream.checksum.fl_str_mv 8a4605be74aa9ea9d79846c1fba20a33
13f3000dbc691885854f8e12f86b620e
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UNIFEI (RIUNIFEI) - Universidade Federal de Itajubá (UNIFEI)
repository.mail.fl_str_mv repositorio@unifei.edu.br || geraldocarlos@unifei.edu.br
_version_ 1801863184672358400