Previsão de evasão em cursos de graduação da Universidade Federal Fluminense com mineração de dados
Autor(a) principal: | |
---|---|
Data de Publicação: | 2019 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da Universidade Federal Fluminense (RIUFF) |
Texto Completo: | http://app.uff.br/riuff/handle/1/25811 |
Resumo: | A evasão de alunos no ensino superior é um problema comumente enfrentado em diversos países no mundo. No Brasil, esse problema é especialmente crítico quando ocorre em instituições federais e estaduais. Isso se deve ao fato que os gastos que o governo teve com esse aluno não terão retorno, uma vez que a chance de ingresso no mercado de trabalho desses alunos é reduzida, e, por consequência, há dificuldade de suprir a demanda interna necessária pelas empresas, importante para o desenvolvimento do país. Então, encontrar formar de auxiliar os alunos para evitar a evasão é essencial para evitar os gastos sem retorno por culpa da evasão. Porém, se essa ajuda for direcionada para todos os alunos, independente de terem chance de eles evadirem ou não, isso ainda traria um gasto adicional para a verba das universidades. Com essa motivação, essa monografia tem o foco de comparar diferentes técnicas clássicas de mineração de dados para verificar a eficácia de cada uma, de forma a prover uma possível solução de detecção precoce de evasão. Ao usar uma técnica automática para prever os prováveis alunos a evadir, pode-se focar recursos para auxiliar esses alunos específicos e assim ter um retorno melhor dos investimentos do governo. Nessa monografia, foram usados métodos usuais de (1) pré-processamento, a saber, um Normalizador e um Padronizador para tratamento de dados, (2) redução de dimensionalidade, a saber, PCA e Qui-Quadrado , e (3) métodos para geração de classificadores baseados em categorias diversas, a saber, KNN, SVM, MLP, CART e XGBoost . Com os resultados experimentais obtidos, foi possível comparar os resultados e elencar o método de Padronização, PCA e XGBoost, como tendo os melhores resultados, atingindo acima de 91% de Acurácia e 0.9542 de F1-Measure para o curso de Física. |
id |
UFF-2_ad16ca7ca874eb0d4a5300808f79e374 |
---|---|
oai_identifier_str |
oai:app.uff.br:1/25811 |
network_acronym_str |
UFF-2 |
network_name_str |
Repositório Institucional da Universidade Federal Fluminense (RIUFF) |
repository_id_str |
2120 |
spelling |
Previsão de evasão em cursos de graduação da Universidade Federal Fluminense com mineração de dadosMineração de DadosPredição de Evasão de AlunosÁrvore de DecisãoXGBoostMineração de dados (Computação)Árvore de decisãoEvasão escolarEstudante universitárioData MiningStudent dropout predictionDecision TreeA evasão de alunos no ensino superior é um problema comumente enfrentado em diversos países no mundo. No Brasil, esse problema é especialmente crítico quando ocorre em instituições federais e estaduais. Isso se deve ao fato que os gastos que o governo teve com esse aluno não terão retorno, uma vez que a chance de ingresso no mercado de trabalho desses alunos é reduzida, e, por consequência, há dificuldade de suprir a demanda interna necessária pelas empresas, importante para o desenvolvimento do país. Então, encontrar formar de auxiliar os alunos para evitar a evasão é essencial para evitar os gastos sem retorno por culpa da evasão. Porém, se essa ajuda for direcionada para todos os alunos, independente de terem chance de eles evadirem ou não, isso ainda traria um gasto adicional para a verba das universidades. Com essa motivação, essa monografia tem o foco de comparar diferentes técnicas clássicas de mineração de dados para verificar a eficácia de cada uma, de forma a prover uma possível solução de detecção precoce de evasão. Ao usar uma técnica automática para prever os prováveis alunos a evadir, pode-se focar recursos para auxiliar esses alunos específicos e assim ter um retorno melhor dos investimentos do governo. Nessa monografia, foram usados métodos usuais de (1) pré-processamento, a saber, um Normalizador e um Padronizador para tratamento de dados, (2) redução de dimensionalidade, a saber, PCA e Qui-Quadrado , e (3) métodos para geração de classificadores baseados em categorias diversas, a saber, KNN, SVM, MLP, CART e XGBoost . Com os resultados experimentais obtidos, foi possível comparar os resultados e elencar o método de Padronização, PCA e XGBoost, como tendo os melhores resultados, atingindo acima de 91% de Acurácia e 0.9542 de F1-Measure para o curso de Física.Student dropout in higher education is a problem commonly faced in many countries around the world. In Brazil, this problem is especially critical when it occurs in federal and state institutions. This is because government spending with this student will not have a return, since the chance of entering the labor market of these students is reduced, and, consequently, it is difficult to supply the internal demand needed by companies, important for the country’s development. So finding a way to help students avoid dropout is essential to avoid spending without return because of dropout. However, if this help is directed to all students, regardless of whether they have a chance of evading or not, it would still bring additional expense to the university funds. With this motivation, this monograph focuses on comparing different classic data mining techniques to verify their effectiveness in order to provide a possible early evasion detection solution. By using an automated technique to predict likely students to drop out, you can focus resources on helping those specific students get a better return on government investment. This monograph used the usual methods of (1) preprocessing, namely, a Normalizer and a Standardizer for data processing, (2) dimensionality reduction, namely PCA and Chi-Square, and (3) methods for generating of classifiers based on various categories, namely, KNN, SVM, MLP, CART, and XGBoost. With the experimental results obtained, it was possible to compare the results and list the methods Standard, PCA and XGBoost, as having the best results, reaching above 91% Accuracy and 0.9542 F1-Measure for the Physics course.52 p.Carvalho, Aline Marins PaesOliveira, Daniel Cardoso Moraes deSilva Junior, Daniel Pinheiro daSantos, Thales Athayde2022-07-25T12:35:53Z2022-07-25T12:35:53Z2019info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfSANTOS, Thales Athayde. Previsão de evasão em cursos de graduação da Universidade Federal Fluminense com mineração de dados. 2019. 52 f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) - Universidade Federal Fluminense, Instituto de Computação, Niterói, 2019http://app.uff.br/riuff/handle/1/25811CC-BY-SAinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF)instname:Universidade Federal Fluminense (UFF)instacron:UFF2022-07-25T12:35:57Zoai:app.uff.br:1/25811Repositório InstitucionalPUBhttps://app.uff.br/oai/requestriuff@id.uff.bropendoar:21202024-08-19T10:57:11.631741Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF)false |
dc.title.none.fl_str_mv |
Previsão de evasão em cursos de graduação da Universidade Federal Fluminense com mineração de dados |
title |
Previsão de evasão em cursos de graduação da Universidade Federal Fluminense com mineração de dados |
spellingShingle |
Previsão de evasão em cursos de graduação da Universidade Federal Fluminense com mineração de dados Santos, Thales Athayde Mineração de Dados Predição de Evasão de Alunos Árvore de Decisão XGBoost Mineração de dados (Computação) Árvore de decisão Evasão escolar Estudante universitário Data Mining Student dropout prediction Decision Tree |
title_short |
Previsão de evasão em cursos de graduação da Universidade Federal Fluminense com mineração de dados |
title_full |
Previsão de evasão em cursos de graduação da Universidade Federal Fluminense com mineração de dados |
title_fullStr |
Previsão de evasão em cursos de graduação da Universidade Federal Fluminense com mineração de dados |
title_full_unstemmed |
Previsão de evasão em cursos de graduação da Universidade Federal Fluminense com mineração de dados |
title_sort |
Previsão de evasão em cursos de graduação da Universidade Federal Fluminense com mineração de dados |
author |
Santos, Thales Athayde |
author_facet |
Santos, Thales Athayde |
author_role |
author |
dc.contributor.none.fl_str_mv |
Carvalho, Aline Marins Paes Oliveira, Daniel Cardoso Moraes de Silva Junior, Daniel Pinheiro da |
dc.contributor.author.fl_str_mv |
Santos, Thales Athayde |
dc.subject.por.fl_str_mv |
Mineração de Dados Predição de Evasão de Alunos Árvore de Decisão XGBoost Mineração de dados (Computação) Árvore de decisão Evasão escolar Estudante universitário Data Mining Student dropout prediction Decision Tree |
topic |
Mineração de Dados Predição de Evasão de Alunos Árvore de Decisão XGBoost Mineração de dados (Computação) Árvore de decisão Evasão escolar Estudante universitário Data Mining Student dropout prediction Decision Tree |
description |
A evasão de alunos no ensino superior é um problema comumente enfrentado em diversos países no mundo. No Brasil, esse problema é especialmente crítico quando ocorre em instituições federais e estaduais. Isso se deve ao fato que os gastos que o governo teve com esse aluno não terão retorno, uma vez que a chance de ingresso no mercado de trabalho desses alunos é reduzida, e, por consequência, há dificuldade de suprir a demanda interna necessária pelas empresas, importante para o desenvolvimento do país. Então, encontrar formar de auxiliar os alunos para evitar a evasão é essencial para evitar os gastos sem retorno por culpa da evasão. Porém, se essa ajuda for direcionada para todos os alunos, independente de terem chance de eles evadirem ou não, isso ainda traria um gasto adicional para a verba das universidades. Com essa motivação, essa monografia tem o foco de comparar diferentes técnicas clássicas de mineração de dados para verificar a eficácia de cada uma, de forma a prover uma possível solução de detecção precoce de evasão. Ao usar uma técnica automática para prever os prováveis alunos a evadir, pode-se focar recursos para auxiliar esses alunos específicos e assim ter um retorno melhor dos investimentos do governo. Nessa monografia, foram usados métodos usuais de (1) pré-processamento, a saber, um Normalizador e um Padronizador para tratamento de dados, (2) redução de dimensionalidade, a saber, PCA e Qui-Quadrado , e (3) métodos para geração de classificadores baseados em categorias diversas, a saber, KNN, SVM, MLP, CART e XGBoost . Com os resultados experimentais obtidos, foi possível comparar os resultados e elencar o método de Padronização, PCA e XGBoost, como tendo os melhores resultados, atingindo acima de 91% de Acurácia e 0.9542 de F1-Measure para o curso de Física. |
publishDate |
2019 |
dc.date.none.fl_str_mv |
2019 2022-07-25T12:35:53Z 2022-07-25T12:35:53Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
SANTOS, Thales Athayde. Previsão de evasão em cursos de graduação da Universidade Federal Fluminense com mineração de dados. 2019. 52 f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) - Universidade Federal Fluminense, Instituto de Computação, Niterói, 2019 http://app.uff.br/riuff/handle/1/25811 |
identifier_str_mv |
SANTOS, Thales Athayde. Previsão de evasão em cursos de graduação da Universidade Federal Fluminense com mineração de dados. 2019. 52 f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) - Universidade Federal Fluminense, Instituto de Computação, Niterói, 2019 |
url |
http://app.uff.br/riuff/handle/1/25811 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
CC-BY-SA info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
CC-BY-SA |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF) instname:Universidade Federal Fluminense (UFF) instacron:UFF |
instname_str |
Universidade Federal Fluminense (UFF) |
instacron_str |
UFF |
institution |
UFF |
reponame_str |
Repositório Institucional da Universidade Federal Fluminense (RIUFF) |
collection |
Repositório Institucional da Universidade Federal Fluminense (RIUFF) |
repository.name.fl_str_mv |
Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF) |
repository.mail.fl_str_mv |
riuff@id.uff.br |
_version_ |
1811823617345847296 |