Métodos de aprendizado de máquina aplicados a evasão escolar

Detalhes bibliográficos
Autor(a) principal: Barbosa, Guilherme Matos, 1991-
Data de Publicação: 2022
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFPR
Texto Completo: https://hdl.handle.net/1884/78993
Resumo: Orientador: Prof. Dr. Wagner Hugo Bonat
id UFPR_1ef9b13d98b8dd798feb794524a23899
oai_identifier_str oai:acervodigital.ufpr.br:1884/78993
network_acronym_str UFPR
network_name_str Repositório Institucional da UFPR
repository_id_str 308
spelling Barbosa, Guilherme Matos, 1991-Universidade Federal do Paraná. Setor de Ciências Exatas. Programa de Pós-Graduação em InformáticaBonat, Wagner Hugo, 1985-2022-10-27T15:32:51Z2022-10-27T15:32:51Z2022https://hdl.handle.net/1884/78993Orientador: Prof. Dr. Wagner Hugo BonatDissertação (mestrado) - Universidade Federal do Paraná, Setor de Ciências Exatas, Programa de Pós-Graduação em Informática. Defesa : Curitiba, 22/06/2022Inclui referências: p. 48-50Área de concentração: Ciência da ComputaçãoResumo: A evasão escolar pode ser definida como a descontinuação de um estudante no seu ensino, podendo ocorrer de diferentes formas e, esse fenômeno, está cada vez mais presente no cenário do ensino superior, inclusive na UFPR (Universidade Federal do Paraná). Torna-se importante então buscar maneiras de reduzir a taxa de evasão e a mineração de dados e as técnicas de aprendizagem de máquina permitem identificar padrões e gerar modelos computacionais que podem predizer se um aluno será um evasor. Na UFPR existe o SIGA (Sistema de Gestão Acadêmica), um sistema integrado que contempla informações sobre matrícula, cursos, professores, disciplinas, frequências, notas, entre outras. Este trabalho, utilizando dados do SIGA, tem como objetivo usar modelos de classificação para predizer quais alunos estão em risco de evasão, assim como identificar os atributos mais determinantes. Para isso, foram aplicadas os algoritmos de regressão logística, árvore de decisão, k-Nearest Neighbours, Support Vector Machine e random forest.A regressão logística, a árvore de decisão e o random forest permitiram identificar que as variáveis mais significativas foram categoria de cota, forma de ingresso, setor de estudo, e considerando o primeiro semestre: índice de rendimento , carga curricular, número de reprovações por frequência e notas. Os melhores resultados de predição foram obtidos pelos algoritmos random forest com AUC de 0,863 e acurácia de 0,734 e o SVM com AUC de 0,847 e acurácia de 0,741.Abstract: School dropout can be defined as the discontinuation of a student in his or her education, and it can occur in different ways, and this phenomenon is increasingly present in the higher education scenario, including at UFPR (Federal University of Paraná). It becomes important then to look for ways to reduce the dropout rate and data mining and machine learning techniques allow to identify patterns and generate computational models that can predict if a student will be a dropout. At UFPR there is SIGA (Academic Management System), an integrated system that includes information about enrollment, courses, professors, subjects, frequencies, grades, among others. This work, using data from SIGA, aims to use classification models to predict which students are at risk of dropping out, as well as to identify the most determinant attributes. To do this, the algorithms logistic regression, decision tree, k-Nearest Neighbours, Support Vector Machine and random forest were applied.The logistic regression, decision tree and random forest allowed us to identify that the most significant variables were quota category, entrance form, study sector, and considering the first semester: performance index , curricular load, number of failures by frequency and grades. The best prediction results were obtained by the algorithms random forest with AUC of 0.863 and accuracy of 0.734 and the SVM with AUC of 0.847 and accuracy of 0.741.1 recurso online : PDF.application/pdfMineração de dados (Computação)AprendizagemEvasão escolarCiência da ComputaçãoMétodos de aprendizado de máquina aplicados a evasão escolarinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisporreponame:Repositório Institucional da UFPRinstname:Universidade Federal do Paraná (UFPR)instacron:UFPRinfo:eu-repo/semantics/openAccessORIGINALR - D - GUILHERME MATOS BARBOSA.pdfapplication/pdf1185752https://acervodigital.ufpr.br/bitstream/1884/78993/1/R%20-%20D%20-%20GUILHERME%20MATOS%20BARBOSA.pdffd23a752cea7bb1ca9539d871f27acb3MD51open access1884/789932022-10-27 12:32:51.637open accessoai:acervodigital.ufpr.br:1884/78993Repositório de PublicaçõesPUBhttp://acervodigital.ufpr.br/oai/requestopendoar:3082022-10-27T15:32:51Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR)false
dc.title.pt_BR.fl_str_mv Métodos de aprendizado de máquina aplicados a evasão escolar
title Métodos de aprendizado de máquina aplicados a evasão escolar
spellingShingle Métodos de aprendizado de máquina aplicados a evasão escolar
Barbosa, Guilherme Matos, 1991-
Mineração de dados (Computação)
Aprendizagem
Evasão escolar
Ciência da Computação
title_short Métodos de aprendizado de máquina aplicados a evasão escolar
title_full Métodos de aprendizado de máquina aplicados a evasão escolar
title_fullStr Métodos de aprendizado de máquina aplicados a evasão escolar
title_full_unstemmed Métodos de aprendizado de máquina aplicados a evasão escolar
title_sort Métodos de aprendizado de máquina aplicados a evasão escolar
author Barbosa, Guilherme Matos, 1991-
author_facet Barbosa, Guilherme Matos, 1991-
author_role author
dc.contributor.other.pt_BR.fl_str_mv Universidade Federal do Paraná. Setor de Ciências Exatas. Programa de Pós-Graduação em Informática
dc.contributor.author.fl_str_mv Barbosa, Guilherme Matos, 1991-
dc.contributor.advisor1.fl_str_mv Bonat, Wagner Hugo, 1985-
contributor_str_mv Bonat, Wagner Hugo, 1985-
dc.subject.por.fl_str_mv Mineração de dados (Computação)
Aprendizagem
Evasão escolar
Ciência da Computação
topic Mineração de dados (Computação)
Aprendizagem
Evasão escolar
Ciência da Computação
description Orientador: Prof. Dr. Wagner Hugo Bonat
publishDate 2022
dc.date.accessioned.fl_str_mv 2022-10-27T15:32:51Z
dc.date.available.fl_str_mv 2022-10-27T15:32:51Z
dc.date.issued.fl_str_mv 2022
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://hdl.handle.net/1884/78993
url https://hdl.handle.net/1884/78993
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 1 recurso online : PDF.
application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPR
instname:Universidade Federal do Paraná (UFPR)
instacron:UFPR
instname_str Universidade Federal do Paraná (UFPR)
instacron_str UFPR
institution UFPR
reponame_str Repositório Institucional da UFPR
collection Repositório Institucional da UFPR
bitstream.url.fl_str_mv https://acervodigital.ufpr.br/bitstream/1884/78993/1/R%20-%20D%20-%20GUILHERME%20MATOS%20BARBOSA.pdf
bitstream.checksum.fl_str_mv fd23a752cea7bb1ca9539d871f27acb3
bitstream.checksumAlgorithm.fl_str_mv MD5
repository.name.fl_str_mv Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR)
repository.mail.fl_str_mv
_version_ 1801860654768848896