Previsão de evasão em cursos de graduação da Universidade Federal Fluminense com mineração de dados

Detalhes bibliográficos
Autor(a) principal: Santos, Thales Athayde
Data de Publicação: 2019
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da Universidade Federal Fluminense (RIUFF)
Texto Completo: http://app.uff.br/riuff/handle/1/25811
Resumo: A evasão de alunos no ensino superior é um problema comumente enfrentado em diversos países no mundo. No Brasil, esse problema é especialmente crítico quando ocorre em instituições federais e estaduais. Isso se deve ao fato que os gastos que o governo teve com esse aluno não terão retorno, uma vez que a chance de ingresso no mercado de trabalho desses alunos é reduzida, e, por consequência, há dificuldade de suprir a demanda interna necessária pelas empresas, importante para o desenvolvimento do país. Então, encontrar formar de auxiliar os alunos para evitar a evasão é essencial para evitar os gastos sem retorno por culpa da evasão. Porém, se essa ajuda for direcionada para todos os alunos, independente de terem chance de eles evadirem ou não, isso ainda traria um gasto adicional para a verba das universidades. Com essa motivação, essa monografia tem o foco de comparar diferentes técnicas clássicas de mineração de dados para verificar a eficácia de cada uma, de forma a prover uma possível solução de detecção precoce de evasão. Ao usar uma técnica automática para prever os prováveis alunos a evadir, pode-se focar recursos para auxiliar esses alunos específicos e assim ter um retorno melhor dos investimentos do governo. Nessa monografia, foram usados métodos usuais de (1) pré-processamento, a saber, um Normalizador e um Padronizador para tratamento de dados, (2) redução de dimensionalidade, a saber, PCA e Qui-Quadrado , e (3) métodos para geração de classificadores baseados em categorias diversas, a saber, KNN, SVM, MLP, CART e XGBoost . Com os resultados experimentais obtidos, foi possível comparar os resultados e elencar o método de Padronização, PCA e XGBoost, como tendo os melhores resultados, atingindo acima de 91% de Acurácia e 0.9542 de F1-Measure para o curso de Física.
id UFF-2_ad16ca7ca874eb0d4a5300808f79e374
oai_identifier_str oai:app.uff.br:1/25811
network_acronym_str UFF-2
network_name_str Repositório Institucional da Universidade Federal Fluminense (RIUFF)
repository_id_str 2120
spelling Previsão de evasão em cursos de graduação da Universidade Federal Fluminense com mineração de dadosMineração de DadosPredição de Evasão de AlunosÁrvore de DecisãoXGBoostMineração de dados (Computação)Árvore de decisãoEvasão escolarEstudante universitárioData MiningStudent dropout predictionDecision TreeA evasão de alunos no ensino superior é um problema comumente enfrentado em diversos países no mundo. No Brasil, esse problema é especialmente crítico quando ocorre em instituições federais e estaduais. Isso se deve ao fato que os gastos que o governo teve com esse aluno não terão retorno, uma vez que a chance de ingresso no mercado de trabalho desses alunos é reduzida, e, por consequência, há dificuldade de suprir a demanda interna necessária pelas empresas, importante para o desenvolvimento do país. Então, encontrar formar de auxiliar os alunos para evitar a evasão é essencial para evitar os gastos sem retorno por culpa da evasão. Porém, se essa ajuda for direcionada para todos os alunos, independente de terem chance de eles evadirem ou não, isso ainda traria um gasto adicional para a verba das universidades. Com essa motivação, essa monografia tem o foco de comparar diferentes técnicas clássicas de mineração de dados para verificar a eficácia de cada uma, de forma a prover uma possível solução de detecção precoce de evasão. Ao usar uma técnica automática para prever os prováveis alunos a evadir, pode-se focar recursos para auxiliar esses alunos específicos e assim ter um retorno melhor dos investimentos do governo. Nessa monografia, foram usados métodos usuais de (1) pré-processamento, a saber, um Normalizador e um Padronizador para tratamento de dados, (2) redução de dimensionalidade, a saber, PCA e Qui-Quadrado , e (3) métodos para geração de classificadores baseados em categorias diversas, a saber, KNN, SVM, MLP, CART e XGBoost . Com os resultados experimentais obtidos, foi possível comparar os resultados e elencar o método de Padronização, PCA e XGBoost, como tendo os melhores resultados, atingindo acima de 91% de Acurácia e 0.9542 de F1-Measure para o curso de Física.Student dropout in higher education is a problem commonly faced in many countries around the world. In Brazil, this problem is especially critical when it occurs in federal and state institutions. This is because government spending with this student will not have a return, since the chance of entering the labor market of these students is reduced, and, consequently, it is difficult to supply the internal demand needed by companies, important for the country’s development. So finding a way to help students avoid dropout is essential to avoid spending without return because of dropout. However, if this help is directed to all students, regardless of whether they have a chance of evading or not, it would still bring additional expense to the university funds. With this motivation, this monograph focuses on comparing different classic data mining techniques to verify their effectiveness in order to provide a possible early evasion detection solution. By using an automated technique to predict likely students to drop out, you can focus resources on helping those specific students get a better return on government investment. This monograph used the usual methods of (1) preprocessing, namely, a Normalizer and a Standardizer for data processing, (2) dimensionality reduction, namely PCA and Chi-Square, and (3) methods for generating of classifiers based on various categories, namely, KNN, SVM, MLP, CART, and XGBoost. With the experimental results obtained, it was possible to compare the results and list the methods Standard, PCA and XGBoost, as having the best results, reaching above 91% Accuracy and 0.9542 F1-Measure for the Physics course.52 p.Carvalho, Aline Marins PaesOliveira, Daniel Cardoso Moraes deSilva Junior, Daniel Pinheiro daSantos, Thales Athayde2022-07-25T12:35:53Z2022-07-25T12:35:53Z2019info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfSANTOS, Thales Athayde. Previsão de evasão em cursos de graduação da Universidade Federal Fluminense com mineração de dados. 2019. 52 f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) - Universidade Federal Fluminense, Instituto de Computação, Niterói, 2019http://app.uff.br/riuff/handle/1/25811CC-BY-SAinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF)instname:Universidade Federal Fluminense (UFF)instacron:UFF2022-07-25T12:35:57Zoai:app.uff.br:1/25811Repositório InstitucionalPUBhttps://app.uff.br/oai/requestriuff@id.uff.bropendoar:21202024-08-19T10:57:11.631741Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF)false
dc.title.none.fl_str_mv Previsão de evasão em cursos de graduação da Universidade Federal Fluminense com mineração de dados
title Previsão de evasão em cursos de graduação da Universidade Federal Fluminense com mineração de dados
spellingShingle Previsão de evasão em cursos de graduação da Universidade Federal Fluminense com mineração de dados
Santos, Thales Athayde
Mineração de Dados
Predição de Evasão de Alunos
Árvore de Decisão
XGBoost
Mineração de dados (Computação)
Árvore de decisão
Evasão escolar
Estudante universitário
Data Mining
Student dropout prediction
Decision Tree
title_short Previsão de evasão em cursos de graduação da Universidade Federal Fluminense com mineração de dados
title_full Previsão de evasão em cursos de graduação da Universidade Federal Fluminense com mineração de dados
title_fullStr Previsão de evasão em cursos de graduação da Universidade Federal Fluminense com mineração de dados
title_full_unstemmed Previsão de evasão em cursos de graduação da Universidade Federal Fluminense com mineração de dados
title_sort Previsão de evasão em cursos de graduação da Universidade Federal Fluminense com mineração de dados
author Santos, Thales Athayde
author_facet Santos, Thales Athayde
author_role author
dc.contributor.none.fl_str_mv Carvalho, Aline Marins Paes
Oliveira, Daniel Cardoso Moraes de
Silva Junior, Daniel Pinheiro da
dc.contributor.author.fl_str_mv Santos, Thales Athayde
dc.subject.por.fl_str_mv Mineração de Dados
Predição de Evasão de Alunos
Árvore de Decisão
XGBoost
Mineração de dados (Computação)
Árvore de decisão
Evasão escolar
Estudante universitário
Data Mining
Student dropout prediction
Decision Tree
topic Mineração de Dados
Predição de Evasão de Alunos
Árvore de Decisão
XGBoost
Mineração de dados (Computação)
Árvore de decisão
Evasão escolar
Estudante universitário
Data Mining
Student dropout prediction
Decision Tree
description A evasão de alunos no ensino superior é um problema comumente enfrentado em diversos países no mundo. No Brasil, esse problema é especialmente crítico quando ocorre em instituições federais e estaduais. Isso se deve ao fato que os gastos que o governo teve com esse aluno não terão retorno, uma vez que a chance de ingresso no mercado de trabalho desses alunos é reduzida, e, por consequência, há dificuldade de suprir a demanda interna necessária pelas empresas, importante para o desenvolvimento do país. Então, encontrar formar de auxiliar os alunos para evitar a evasão é essencial para evitar os gastos sem retorno por culpa da evasão. Porém, se essa ajuda for direcionada para todos os alunos, independente de terem chance de eles evadirem ou não, isso ainda traria um gasto adicional para a verba das universidades. Com essa motivação, essa monografia tem o foco de comparar diferentes técnicas clássicas de mineração de dados para verificar a eficácia de cada uma, de forma a prover uma possível solução de detecção precoce de evasão. Ao usar uma técnica automática para prever os prováveis alunos a evadir, pode-se focar recursos para auxiliar esses alunos específicos e assim ter um retorno melhor dos investimentos do governo. Nessa monografia, foram usados métodos usuais de (1) pré-processamento, a saber, um Normalizador e um Padronizador para tratamento de dados, (2) redução de dimensionalidade, a saber, PCA e Qui-Quadrado , e (3) métodos para geração de classificadores baseados em categorias diversas, a saber, KNN, SVM, MLP, CART e XGBoost . Com os resultados experimentais obtidos, foi possível comparar os resultados e elencar o método de Padronização, PCA e XGBoost, como tendo os melhores resultados, atingindo acima de 91% de Acurácia e 0.9542 de F1-Measure para o curso de Física.
publishDate 2019
dc.date.none.fl_str_mv 2019
2022-07-25T12:35:53Z
2022-07-25T12:35:53Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv SANTOS, Thales Athayde. Previsão de evasão em cursos de graduação da Universidade Federal Fluminense com mineração de dados. 2019. 52 f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) - Universidade Federal Fluminense, Instituto de Computação, Niterói, 2019
http://app.uff.br/riuff/handle/1/25811
identifier_str_mv SANTOS, Thales Athayde. Previsão de evasão em cursos de graduação da Universidade Federal Fluminense com mineração de dados. 2019. 52 f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) - Universidade Federal Fluminense, Instituto de Computação, Niterói, 2019
url http://app.uff.br/riuff/handle/1/25811
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv CC-BY-SA
info:eu-repo/semantics/openAccess
rights_invalid_str_mv CC-BY-SA
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF)
instname:Universidade Federal Fluminense (UFF)
instacron:UFF
instname_str Universidade Federal Fluminense (UFF)
instacron_str UFF
institution UFF
reponame_str Repositório Institucional da Universidade Federal Fluminense (RIUFF)
collection Repositório Institucional da Universidade Federal Fluminense (RIUFF)
repository.name.fl_str_mv Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF)
repository.mail.fl_str_mv riuff@id.uff.br
_version_ 1811823617345847296