Uma comparação de técnicas de Aprendizado de Máquina para predição de evasão de estudantes no ensino público superior
Autor(a) principal: | |
---|---|
Data de Publicação: | 2022 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da USP |
Texto Completo: | https://www.teses.usp.br/teses/disponiveis/100/100131/tde-23052022-092609/ |
Resumo: | A evasão de alunos dos cursos ou das instituições de ensino públicas contribui para um problema de falta de mão de obra qualificada no mercado de trabalho, pois novos profissionais deixam de ser formados e vagas que necessitam de profissionais qualificados ficam ociosas. Além disso, instituições que têm consideráveis perdas de alunos também têm perdas de verbas que poderiam ser utilizadas para mantê-las em bom funcionamento. Adicionalmente à problemática da evasão no ensino superior estão as diferentes situações em que o aluno pode estar no sistema de ensino. De acordo com o Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira (INEP), estas situações podem ser classificadas como: alunos com matrícula trancada, alunos desvinculados do curso (alunos evadidos) e alunos transferidos para outro curso da mesma instituição. Dessa forma, o presente trabalho tem por objetivo geral fazer a aplicação de técnicas de aprendizado de máquina em uma base de dados pública para identificar estudantes que estão em diferentes situações no ensino superior brasileiro, conforme identificadas na base de dados disponibilizada pelo INEP. Das técnicas aplicadas(árvores de decisão, Naive Bayes, Regressão Logística e Redes Neurais), as que melhor resultado apresentaram, em termos de acurácia, sensibilidade e especificidade, foram Árvores de decisão apresentando 73% de acurácia, 60% de sensibilidade e 89%de especificidade. Seguido pela técnica de regressão logística com 54% de acurácia, 55% de sensibilidade e 85% de especificidade. Por fim, foi disponibilizado o melhor modelo para a predição dos diferentes vínculos que o aluno pode ter em relação ao ensino superior |
id |
USP_c03e59549682e10f1ffd36f6d1ef69fc |
---|---|
oai_identifier_str |
oai:teses.usp.br:tde-23052022-092609 |
network_acronym_str |
USP |
network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
repository_id_str |
2721 |
spelling |
Uma comparação de técnicas de Aprendizado de Máquina para predição de evasão de estudantes no ensino público superiorA comparison of Machine Learning techniques for predicting student dropout in public higher educationAprendizado de máquinaClassificação multiclasseEnsino superiorHigher educationMachine learningMulticlass classificationA evasão de alunos dos cursos ou das instituições de ensino públicas contribui para um problema de falta de mão de obra qualificada no mercado de trabalho, pois novos profissionais deixam de ser formados e vagas que necessitam de profissionais qualificados ficam ociosas. Além disso, instituições que têm consideráveis perdas de alunos também têm perdas de verbas que poderiam ser utilizadas para mantê-las em bom funcionamento. Adicionalmente à problemática da evasão no ensino superior estão as diferentes situações em que o aluno pode estar no sistema de ensino. De acordo com o Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira (INEP), estas situações podem ser classificadas como: alunos com matrícula trancada, alunos desvinculados do curso (alunos evadidos) e alunos transferidos para outro curso da mesma instituição. Dessa forma, o presente trabalho tem por objetivo geral fazer a aplicação de técnicas de aprendizado de máquina em uma base de dados pública para identificar estudantes que estão em diferentes situações no ensino superior brasileiro, conforme identificadas na base de dados disponibilizada pelo INEP. Das técnicas aplicadas(árvores de decisão, Naive Bayes, Regressão Logística e Redes Neurais), as que melhor resultado apresentaram, em termos de acurácia, sensibilidade e especificidade, foram Árvores de decisão apresentando 73% de acurácia, 60% de sensibilidade e 89%de especificidade. Seguido pela técnica de regressão logística com 54% de acurácia, 55% de sensibilidade e 85% de especificidade. Por fim, foi disponibilizado o melhor modelo para a predição dos diferentes vínculos que o aluno pode ter em relação ao ensino superiorThe desertion of students from public educational institutions contributes to the problem of lack of qualified professionals in the laboral market, because of new professionals are no longer trained and jobs that need qualified professionals remain vacant. In addition, institutions that have considerable student losses also have lost funds that could be used to keep them working. In addition, there are different. situations in which the students may be in the education system. According to the Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira (INEP), these situations can be classified as: students with locked enrollment, students unlinked to a course (evaded students) and students transferred to another course of the same institution. Thus, the present work aims to apply machine learning techniques in a public database to identify students who are in different situations in Brazilian higher education, as identified in the database provided by INEP. Of the applied techniques (decision trees, Naive Bayes, Logistic Regression and Neural Networks), the ones that presented the best results, in terms of accuracy, sensitivity and specificity, were Decision Trees presenting 73% of accuracy, 60% of sensitivity and 89%specificity. Followed by the logistic regression technique with 54% accuracy, 55% sensitivity and 85% specificity. Finally, the best model was made available for the prediction of the different bonds that the student may have in relation to higher educationBiblioteca Digitais de Teses e Dissertações da USPRoman, Norton TrevisanSilva, Jailma Januário da2022-03-25info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/100/100131/tde-23052022-092609/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2022-05-27T17:28:26Zoai:teses.usp.br:tde-23052022-092609Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212022-05-27T17:28:26Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
dc.title.none.fl_str_mv |
Uma comparação de técnicas de Aprendizado de Máquina para predição de evasão de estudantes no ensino público superior A comparison of Machine Learning techniques for predicting student dropout in public higher education |
title |
Uma comparação de técnicas de Aprendizado de Máquina para predição de evasão de estudantes no ensino público superior |
spellingShingle |
Uma comparação de técnicas de Aprendizado de Máquina para predição de evasão de estudantes no ensino público superior Silva, Jailma Januário da Aprendizado de máquina Classificação multiclasse Ensino superior Higher education Machine learning Multiclass classification |
title_short |
Uma comparação de técnicas de Aprendizado de Máquina para predição de evasão de estudantes no ensino público superior |
title_full |
Uma comparação de técnicas de Aprendizado de Máquina para predição de evasão de estudantes no ensino público superior |
title_fullStr |
Uma comparação de técnicas de Aprendizado de Máquina para predição de evasão de estudantes no ensino público superior |
title_full_unstemmed |
Uma comparação de técnicas de Aprendizado de Máquina para predição de evasão de estudantes no ensino público superior |
title_sort |
Uma comparação de técnicas de Aprendizado de Máquina para predição de evasão de estudantes no ensino público superior |
author |
Silva, Jailma Januário da |
author_facet |
Silva, Jailma Januário da |
author_role |
author |
dc.contributor.none.fl_str_mv |
Roman, Norton Trevisan |
dc.contributor.author.fl_str_mv |
Silva, Jailma Januário da |
dc.subject.por.fl_str_mv |
Aprendizado de máquina Classificação multiclasse Ensino superior Higher education Machine learning Multiclass classification |
topic |
Aprendizado de máquina Classificação multiclasse Ensino superior Higher education Machine learning Multiclass classification |
description |
A evasão de alunos dos cursos ou das instituições de ensino públicas contribui para um problema de falta de mão de obra qualificada no mercado de trabalho, pois novos profissionais deixam de ser formados e vagas que necessitam de profissionais qualificados ficam ociosas. Além disso, instituições que têm consideráveis perdas de alunos também têm perdas de verbas que poderiam ser utilizadas para mantê-las em bom funcionamento. Adicionalmente à problemática da evasão no ensino superior estão as diferentes situações em que o aluno pode estar no sistema de ensino. De acordo com o Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira (INEP), estas situações podem ser classificadas como: alunos com matrícula trancada, alunos desvinculados do curso (alunos evadidos) e alunos transferidos para outro curso da mesma instituição. Dessa forma, o presente trabalho tem por objetivo geral fazer a aplicação de técnicas de aprendizado de máquina em uma base de dados pública para identificar estudantes que estão em diferentes situações no ensino superior brasileiro, conforme identificadas na base de dados disponibilizada pelo INEP. Das técnicas aplicadas(árvores de decisão, Naive Bayes, Regressão Logística e Redes Neurais), as que melhor resultado apresentaram, em termos de acurácia, sensibilidade e especificidade, foram Árvores de decisão apresentando 73% de acurácia, 60% de sensibilidade e 89%de especificidade. Seguido pela técnica de regressão logística com 54% de acurácia, 55% de sensibilidade e 85% de especificidade. Por fim, foi disponibilizado o melhor modelo para a predição dos diferentes vínculos que o aluno pode ter em relação ao ensino superior |
publishDate |
2022 |
dc.date.none.fl_str_mv |
2022-03-25 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/100/100131/tde-23052022-092609/ |
url |
https://www.teses.usp.br/teses/disponiveis/100/100131/tde-23052022-092609/ |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
|
dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.coverage.none.fl_str_mv |
|
dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
instname_str |
Universidade de São Paulo (USP) |
instacron_str |
USP |
institution |
USP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
collection |
Biblioteca Digital de Teses e Dissertações da USP |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
_version_ |
1809091014905823232 |