Predição de aprovação em um curso em tecnologia da Informação no Instituto Metrópole Digital da UFRN: uma aplicação da análise de regressão logística

Detalhes bibliográficos
Autor(a) principal: Carelli, Diego Silva Campos
Data de Publicação: 2017
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UFRN
Texto Completo: https://repositorio.ufrn.br/handle/123456789/34318
Resumo: A common school performance indicator in educational learning processes is the rate of approved students. Relating this rate to student's characteristics can provide a means to understand the approval process and to improve student's achievement. In this work, logistic regression analysis is applied to model the probability of approval of 1.270 students in a technical course of the Digital Metropolis Institute of the Federal University of Rio Grande do Norte. The logit of the probability of approval is estimated by a linear combination involving the main effects of the variables gender, age, number of course absences, argument in the institution admission exam, duration of the high school course, instruction of the student's father, as well as the interactions sex and age, sex and number of absences and age and number of absences. The suitability of the model fit is confirmed by the Hosmer-Lemeshow statistics, examination of the model residuals and analysis of diagnostic measures. Also, the model has specificity of 84.3%, sensitivity of 94.2%, overall rate of correct classifications of 89.2% and area under the ROC curve equal to 0.956, suggesting therefore the model has high predictive ability. In short, keeping the effects of the other variables fixed, it is observed that the chance of approval estimated by the model: (i) increases with the increasing of age among male students; (ii) decreases with the increase in the number of absences, especially among female students; (iii) increases with the increase of the argument of entrance in the institution; (iv) is lower among those who do not attend high school or attend high school but have not graduated yet than the chance of approval of students who have taken three years or less to complete high school; (v) is lower among those whose father's education is complete high school, do not know or the father is deceased than the chance among students whose parents are illiterate or have incomplete elementary education.
id UFRN_205abf62f4984858cbe7bda250075a85
oai_identifier_str oai:https://repositorio.ufrn.br:123456789/34318
network_acronym_str UFRN
network_name_str Repositório Institucional da UFRN
repository_id_str
spelling Carelli, Diego Silva CamposSilva, Damião Nóbrega daBarbosa, Denize AraújoPereira, Marcelo BourguignonSilva, Damião Nóbrega da2017-05-09T18:09:13Z2021-09-20T12:09:10Z2017-05-09T18:09:13Z2021-09-20T12:09:10Z2017-02-102010051556CARELLI, Diego Silva Campos. Predição de aprovação em um curso em tecnologia da informação no Instituto Metrópole Digital da UFRN: uma aplicação da análise de regressão logística. 2017. 104 f. Monografia (Graduação) - Curso de Estatística, Universidade Federal do Rio Grande do Norte, Natal, 2017.https://repositorio.ufrn.br/handle/123456789/34318A common school performance indicator in educational learning processes is the rate of approved students. Relating this rate to student's characteristics can provide a means to understand the approval process and to improve student's achievement. In this work, logistic regression analysis is applied to model the probability of approval of 1.270 students in a technical course of the Digital Metropolis Institute of the Federal University of Rio Grande do Norte. The logit of the probability of approval is estimated by a linear combination involving the main effects of the variables gender, age, number of course absences, argument in the institution admission exam, duration of the high school course, instruction of the student's father, as well as the interactions sex and age, sex and number of absences and age and number of absences. The suitability of the model fit is confirmed by the Hosmer-Lemeshow statistics, examination of the model residuals and analysis of diagnostic measures. Also, the model has specificity of 84.3%, sensitivity of 94.2%, overall rate of correct classifications of 89.2% and area under the ROC curve equal to 0.956, suggesting therefore the model has high predictive ability. In short, keeping the effects of the other variables fixed, it is observed that the chance of approval estimated by the model: (i) increases with the increasing of age among male students; (ii) decreases with the increase in the number of absences, especially among female students; (iii) increases with the increase of the argument of entrance in the institution; (iv) is lower among those who do not attend high school or attend high school but have not graduated yet than the chance of approval of students who have taken three years or less to complete high school; (v) is lower among those whose father's education is complete high school, do not know or the father is deceased than the chance among students whose parents are illiterate or have incomplete elementary education.Um indicador comum de rendimento escolar em processos de aprendizagem educacional é a taxa de alunos aprovados. Relacionar esta taxa com características dos alunos pode fornecer um meio para compreender o processo de aprovação e apontar caminhos para melhorar o rendimento dos alunos. Neste trabalho, a análise de regressão logística é aplicada para modelar a probabilidade de aprovação de 1.270 estudantes em um curso técnico do Instituto Metrópole Digital da Universidade Federal do Rio Grande do Norte. O logito da probabilidade de aprovação é estimado por uma combinação linear envolvendo efeitos principais das variáveis sexo, idade, número de faltas no curso, argumento no exame de admissão na instituição, duração do curso de ensino médio e instrução do pai do aluno, além das interações entre sexo e idade, entre sexo e número de faltas e entre idade e número de faltas. A adequabilidade do modelo é confirmada pela estatística de Hosmer-Lemeshow, análise dos resíduos e análises de medidas de diagnósticos. Também, o modelo apresenta especifidade de 84,3%, sensibilidade de 94,2%, taxa global de classificação correta de 89,2% e área sob a curva ROC igual a 0,956, sugerindo uma elevada capacidade preditiva. Em linhas gerais, mantendo-se fixos os efeitos das outras variáveis, observa-se que a chance de aprovação estimada pelo modelo: (i) cresce com o aumento da idade entre os alunos do sexo masculino; (ii) diminui com o incremento do número de faltas, principalmente entre estudantes do sexo feminino; (iii) cresce com o aumento do argumento de entrada na instituição; (iv) é menor entre aqueles que não cursam o ensino médio ou que cursam o ensino médio mas não concluíram ainda do que a chance de aprovação dos alunos que levaram três anos ou menos para concluir o ensino médio; (v) é menor entre aqueles cuja instrução do pai é ensino superior completo, desconhece ou o pai é falecido do que a chance entre os alunos cujos pais são analfabetos ou possuem ensino fundamental incompleto.Universidade Federal do Rio Grande do NorteUFRNBrasilEstatísticaAnalise de resíduosCurva ROCDiagnósticosEducação a distânciaPredição de aprovação em um curso em tecnologia da Informação no Instituto Metrópole Digital da UFRN: uma aplicação da análise de regressão logísticainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFRNinstname:Universidade Federal do Rio Grande do Norte (UFRN)instacron:UFRNTEXTRegressaoLogistica_Carelli_2017.pdf.txtExtracted texttext/plain169718https://repositorio.ufrn.br/bitstream/123456789/34318/1/RegressaoLogistica_Carelli_2017.pdf.txtd83b2c13819508d33466f249242044c5MD51LICENSElicense.txttext/plain756https://repositorio.ufrn.br/bitstream/123456789/34318/2/license.txta80a9cda2756d355b388cc443c3d8a43MD52ORIGINALRegressaoLogistica_Carelli_2017.pdfMonografiaapplication/pdf1176821https://repositorio.ufrn.br/bitstream/123456789/34318/3/RegressaoLogistica_Carelli_2017.pdffadfd91e51a0eda9842e6af32ab160b4MD53123456789/343182021-09-20 09:09:10.476oai:https://repositorio.ufrn.br:123456789/34318PGNlbnRlcj48c3Ryb25nPlVOSVZFUlNJREFERSBGRURFUkFMIERPIFJJTyBHUkFOREUgRE8gTk9SVEU8L3N0cm9uZz48L2NlbnRlcj4KPGNlbnRlcj48c3Ryb25nPkJJQkxJT1RFQ0EgRElHSVRBTCBERSBNT05PR1JBRklBUzwvc3Ryb25nPjwvY2VudGVyPgoKPGNlbnRlcj5UZXJtbyBkZSBBdXRvcml6YcOnw6NvIHBhcmEgZGlzcG9uaWJpbGl6YcOnw6NvIGRlIE1vbm9ncmFmaWFzIGRlIEdyYWR1YcOnw6NvIGUgRXNwZWNpYWxpemHDp8OjbyBuYSBCaWJsaW90ZWNhIERpZ2l0YWwgZGUgTW9ub2dyYWZpYXMgKEJETSk8L2NlbnRlcj4KCk5hIHF1YWxpZGFkZSBkZSB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvciBkYSBtb25vZ3JhZmlhLCBhdXRvcml6byBhIFVuaXZlcnNpZGFkZSBGZWRlcmFsIGRvIFJpbyBHcmFuZGUgZG8gTm9ydGUgKFVGUk4pIGEgZGlzcG9uaWJpbGl6YXIgYXRyYXbDqXMgZGEgQmlibGlvdGVjYSBEaWdpdGFsIGRlIE1vbm9ncmFmaWFzIGRhIFVGUk4sIHNlbSByZXNzYXJjaW1lbnRvIGRvcyBkaXJlaXRvcyBhdXRvcmFpcywgZGUgYWNvcmRvIGNvbSBhIExlaSBuwrAgOTYxMC85OCwgbyB0ZXh0byBpbnRlZ3JhbCBkYSBvYnJhIHN1Ym1ldGlkYSBwYXJhIGZpbnMgZGUgbGVpdHVyYSwgaW1wcmVzc8OjbyBlL291IGRvd25sb2FkLCBhIHTDrXR1bG8gZGUgZGl2dWxnYcOnw6NvIGRhIHByb2R1w6fDo28gY2llbnTDrWZpY2EgYnJhc2lsZWlyYSwgYSBwYXJ0aXIgZGEgZGF0YSBkZXN0YSBzdWJtaXNzw6NvLiAKRepositório de PublicaçõesPUBhttp://repositorio.ufrn.br/oai/opendoar:2021-09-20T12:09:10Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)false
dc.title.pr_BR.fl_str_mv Predição de aprovação em um curso em tecnologia da Informação no Instituto Metrópole Digital da UFRN: uma aplicação da análise de regressão logística
title Predição de aprovação em um curso em tecnologia da Informação no Instituto Metrópole Digital da UFRN: uma aplicação da análise de regressão logística
spellingShingle Predição de aprovação em um curso em tecnologia da Informação no Instituto Metrópole Digital da UFRN: uma aplicação da análise de regressão logística
Carelli, Diego Silva Campos
Analise de resíduos
Curva ROC
Diagnósticos
Educação a distância
title_short Predição de aprovação em um curso em tecnologia da Informação no Instituto Metrópole Digital da UFRN: uma aplicação da análise de regressão logística
title_full Predição de aprovação em um curso em tecnologia da Informação no Instituto Metrópole Digital da UFRN: uma aplicação da análise de regressão logística
title_fullStr Predição de aprovação em um curso em tecnologia da Informação no Instituto Metrópole Digital da UFRN: uma aplicação da análise de regressão logística
title_full_unstemmed Predição de aprovação em um curso em tecnologia da Informação no Instituto Metrópole Digital da UFRN: uma aplicação da análise de regressão logística
title_sort Predição de aprovação em um curso em tecnologia da Informação no Instituto Metrópole Digital da UFRN: uma aplicação da análise de regressão logística
author Carelli, Diego Silva Campos
author_facet Carelli, Diego Silva Campos
author_role author
dc.contributor.referees1.none.fl_str_mv Silva, Damião Nóbrega da
dc.contributor.referees2.none.fl_str_mv Barbosa, Denize Araújo
dc.contributor.referees3.none.fl_str_mv Pereira, Marcelo Bourguignon
dc.contributor.author.fl_str_mv Carelli, Diego Silva Campos
dc.contributor.advisor1.fl_str_mv Silva, Damião Nóbrega da
contributor_str_mv Silva, Damião Nóbrega da
dc.subject.pr_BR.fl_str_mv Analise de resíduos
Curva ROC
Diagnósticos
Educação a distância
topic Analise de resíduos
Curva ROC
Diagnósticos
Educação a distância
description A common school performance indicator in educational learning processes is the rate of approved students. Relating this rate to student's characteristics can provide a means to understand the approval process and to improve student's achievement. In this work, logistic regression analysis is applied to model the probability of approval of 1.270 students in a technical course of the Digital Metropolis Institute of the Federal University of Rio Grande do Norte. The logit of the probability of approval is estimated by a linear combination involving the main effects of the variables gender, age, number of course absences, argument in the institution admission exam, duration of the high school course, instruction of the student's father, as well as the interactions sex and age, sex and number of absences and age and number of absences. The suitability of the model fit is confirmed by the Hosmer-Lemeshow statistics, examination of the model residuals and analysis of diagnostic measures. Also, the model has specificity of 84.3%, sensitivity of 94.2%, overall rate of correct classifications of 89.2% and area under the ROC curve equal to 0.956, suggesting therefore the model has high predictive ability. In short, keeping the effects of the other variables fixed, it is observed that the chance of approval estimated by the model: (i) increases with the increasing of age among male students; (ii) decreases with the increase in the number of absences, especially among female students; (iii) increases with the increase of the argument of entrance in the institution; (iv) is lower among those who do not attend high school or attend high school but have not graduated yet than the chance of approval of students who have taken three years or less to complete high school; (v) is lower among those whose father's education is complete high school, do not know or the father is deceased than the chance among students whose parents are illiterate or have incomplete elementary education.
publishDate 2017
dc.date.accessioned.fl_str_mv 2017-05-09T18:09:13Z
2021-09-20T12:09:10Z
dc.date.available.fl_str_mv 2017-05-09T18:09:13Z
2021-09-20T12:09:10Z
dc.date.issued.fl_str_mv 2017-02-10
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.pr_BR.fl_str_mv 2010051556
dc.identifier.citation.fl_str_mv CARELLI, Diego Silva Campos. Predição de aprovação em um curso em tecnologia da informação no Instituto Metrópole Digital da UFRN: uma aplicação da análise de regressão logística. 2017. 104 f. Monografia (Graduação) - Curso de Estatística, Universidade Federal do Rio Grande do Norte, Natal, 2017.
dc.identifier.uri.fl_str_mv https://repositorio.ufrn.br/handle/123456789/34318
identifier_str_mv 2010051556
CARELLI, Diego Silva Campos. Predição de aprovação em um curso em tecnologia da informação no Instituto Metrópole Digital da UFRN: uma aplicação da análise de regressão logística. 2017. 104 f. Monografia (Graduação) - Curso de Estatística, Universidade Federal do Rio Grande do Norte, Natal, 2017.
url https://repositorio.ufrn.br/handle/123456789/34318
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal do Rio Grande do Norte
dc.publisher.initials.fl_str_mv UFRN
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Estatística
publisher.none.fl_str_mv Universidade Federal do Rio Grande do Norte
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRN
instname:Universidade Federal do Rio Grande do Norte (UFRN)
instacron:UFRN
instname_str Universidade Federal do Rio Grande do Norte (UFRN)
instacron_str UFRN
institution UFRN
reponame_str Repositório Institucional da UFRN
collection Repositório Institucional da UFRN
bitstream.url.fl_str_mv https://repositorio.ufrn.br/bitstream/123456789/34318/1/RegressaoLogistica_Carelli_2017.pdf.txt
https://repositorio.ufrn.br/bitstream/123456789/34318/2/license.txt
https://repositorio.ufrn.br/bitstream/123456789/34318/3/RegressaoLogistica_Carelli_2017.pdf
bitstream.checksum.fl_str_mv d83b2c13819508d33466f249242044c5
a80a9cda2756d355b388cc443c3d8a43
fadfd91e51a0eda9842e6af32ab160b4
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)
repository.mail.fl_str_mv
_version_ 1802117612526632960