Uma comparação de técnicas de Aprendizado de Máquina para predição de evasão de estudantes no ensino público superior

Detalhes bibliográficos
Autor(a) principal: Silva, Jailma Januário da
Data de Publicação: 2022
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da USP
Texto Completo: https://www.teses.usp.br/teses/disponiveis/100/100131/tde-23052022-092609/
Resumo: A evasão de alunos dos cursos ou das instituições de ensino públicas contribui para um problema de falta de mão de obra qualificada no mercado de trabalho, pois novos profissionais deixam de ser formados e vagas que necessitam de profissionais qualificados ficam ociosas. Além disso, instituições que têm consideráveis perdas de alunos também têm perdas de verbas que poderiam ser utilizadas para mantê-las em bom funcionamento. Adicionalmente à problemática da evasão no ensino superior estão as diferentes situações em que o aluno pode estar no sistema de ensino. De acordo com o Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira (INEP), estas situações podem ser classificadas como: alunos com matrícula trancada, alunos desvinculados do curso (alunos evadidos) e alunos transferidos para outro curso da mesma instituição. Dessa forma, o presente trabalho tem por objetivo geral fazer a aplicação de técnicas de aprendizado de máquina em uma base de dados pública para identificar estudantes que estão em diferentes situações no ensino superior brasileiro, conforme identificadas na base de dados disponibilizada pelo INEP. Das técnicas aplicadas(árvores de decisão, Naive Bayes, Regressão Logística e Redes Neurais), as que melhor resultado apresentaram, em termos de acurácia, sensibilidade e especificidade, foram Árvores de decisão apresentando 73% de acurácia, 60% de sensibilidade e 89%de especificidade. Seguido pela técnica de regressão logística com 54% de acurácia, 55% de sensibilidade e 85% de especificidade. Por fim, foi disponibilizado o melhor modelo para a predição dos diferentes vínculos que o aluno pode ter em relação ao ensino superior
id USP_c03e59549682e10f1ffd36f6d1ef69fc
oai_identifier_str oai:teses.usp.br:tde-23052022-092609
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str 2721
spelling Uma comparação de técnicas de Aprendizado de Máquina para predição de evasão de estudantes no ensino público superiorA comparison of Machine Learning techniques for predicting student dropout in public higher educationAprendizado de máquinaClassificação multiclasseEnsino superiorHigher educationMachine learningMulticlass classificationA evasão de alunos dos cursos ou das instituições de ensino públicas contribui para um problema de falta de mão de obra qualificada no mercado de trabalho, pois novos profissionais deixam de ser formados e vagas que necessitam de profissionais qualificados ficam ociosas. Além disso, instituições que têm consideráveis perdas de alunos também têm perdas de verbas que poderiam ser utilizadas para mantê-las em bom funcionamento. Adicionalmente à problemática da evasão no ensino superior estão as diferentes situações em que o aluno pode estar no sistema de ensino. De acordo com o Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira (INEP), estas situações podem ser classificadas como: alunos com matrícula trancada, alunos desvinculados do curso (alunos evadidos) e alunos transferidos para outro curso da mesma instituição. Dessa forma, o presente trabalho tem por objetivo geral fazer a aplicação de técnicas de aprendizado de máquina em uma base de dados pública para identificar estudantes que estão em diferentes situações no ensino superior brasileiro, conforme identificadas na base de dados disponibilizada pelo INEP. Das técnicas aplicadas(árvores de decisão, Naive Bayes, Regressão Logística e Redes Neurais), as que melhor resultado apresentaram, em termos de acurácia, sensibilidade e especificidade, foram Árvores de decisão apresentando 73% de acurácia, 60% de sensibilidade e 89%de especificidade. Seguido pela técnica de regressão logística com 54% de acurácia, 55% de sensibilidade e 85% de especificidade. Por fim, foi disponibilizado o melhor modelo para a predição dos diferentes vínculos que o aluno pode ter em relação ao ensino superiorThe desertion of students from public educational institutions contributes to the problem of lack of qualified professionals in the laboral market, because of new professionals are no longer trained and jobs that need qualified professionals remain vacant. In addition, institutions that have considerable student losses also have lost funds that could be used to keep them working. In addition, there are different. situations in which the students may be in the education system. According to the Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira (INEP), these situations can be classified as: students with locked enrollment, students unlinked to a course (evaded students) and students transferred to another course of the same institution. Thus, the present work aims to apply machine learning techniques in a public database to identify students who are in different situations in Brazilian higher education, as identified in the database provided by INEP. Of the applied techniques (decision trees, Naive Bayes, Logistic Regression and Neural Networks), the ones that presented the best results, in terms of accuracy, sensitivity and specificity, were Decision Trees presenting 73% of accuracy, 60% of sensitivity and 89%specificity. Followed by the logistic regression technique with 54% accuracy, 55% sensitivity and 85% specificity. Finally, the best model was made available for the prediction of the different bonds that the student may have in relation to higher educationBiblioteca Digitais de Teses e Dissertações da USPRoman, Norton TrevisanSilva, Jailma Januário da2022-03-25info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/100/100131/tde-23052022-092609/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2022-05-27T17:28:26Zoai:teses.usp.br:tde-23052022-092609Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212022-05-27T17:28:26Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Uma comparação de técnicas de Aprendizado de Máquina para predição de evasão de estudantes no ensino público superior
A comparison of Machine Learning techniques for predicting student dropout in public higher education
title Uma comparação de técnicas de Aprendizado de Máquina para predição de evasão de estudantes no ensino público superior
spellingShingle Uma comparação de técnicas de Aprendizado de Máquina para predição de evasão de estudantes no ensino público superior
Silva, Jailma Januário da
Aprendizado de máquina
Classificação multiclasse
Ensino superior
Higher education
Machine learning
Multiclass classification
title_short Uma comparação de técnicas de Aprendizado de Máquina para predição de evasão de estudantes no ensino público superior
title_full Uma comparação de técnicas de Aprendizado de Máquina para predição de evasão de estudantes no ensino público superior
title_fullStr Uma comparação de técnicas de Aprendizado de Máquina para predição de evasão de estudantes no ensino público superior
title_full_unstemmed Uma comparação de técnicas de Aprendizado de Máquina para predição de evasão de estudantes no ensino público superior
title_sort Uma comparação de técnicas de Aprendizado de Máquina para predição de evasão de estudantes no ensino público superior
author Silva, Jailma Januário da
author_facet Silva, Jailma Januário da
author_role author
dc.contributor.none.fl_str_mv Roman, Norton Trevisan
dc.contributor.author.fl_str_mv Silva, Jailma Januário da
dc.subject.por.fl_str_mv Aprendizado de máquina
Classificação multiclasse
Ensino superior
Higher education
Machine learning
Multiclass classification
topic Aprendizado de máquina
Classificação multiclasse
Ensino superior
Higher education
Machine learning
Multiclass classification
description A evasão de alunos dos cursos ou das instituições de ensino públicas contribui para um problema de falta de mão de obra qualificada no mercado de trabalho, pois novos profissionais deixam de ser formados e vagas que necessitam de profissionais qualificados ficam ociosas. Além disso, instituições que têm consideráveis perdas de alunos também têm perdas de verbas que poderiam ser utilizadas para mantê-las em bom funcionamento. Adicionalmente à problemática da evasão no ensino superior estão as diferentes situações em que o aluno pode estar no sistema de ensino. De acordo com o Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira (INEP), estas situações podem ser classificadas como: alunos com matrícula trancada, alunos desvinculados do curso (alunos evadidos) e alunos transferidos para outro curso da mesma instituição. Dessa forma, o presente trabalho tem por objetivo geral fazer a aplicação de técnicas de aprendizado de máquina em uma base de dados pública para identificar estudantes que estão em diferentes situações no ensino superior brasileiro, conforme identificadas na base de dados disponibilizada pelo INEP. Das técnicas aplicadas(árvores de decisão, Naive Bayes, Regressão Logística e Redes Neurais), as que melhor resultado apresentaram, em termos de acurácia, sensibilidade e especificidade, foram Árvores de decisão apresentando 73% de acurácia, 60% de sensibilidade e 89%de especificidade. Seguido pela técnica de regressão logística com 54% de acurácia, 55% de sensibilidade e 85% de especificidade. Por fim, foi disponibilizado o melhor modelo para a predição dos diferentes vínculos que o aluno pode ter em relação ao ensino superior
publishDate 2022
dc.date.none.fl_str_mv 2022-03-25
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/100/100131/tde-23052022-092609/
url https://www.teses.usp.br/teses/disponiveis/100/100131/tde-23052022-092609/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1809091014905823232