Modelo de análise e predição do desempenho dos alunos dos Institutos Federais de Educação usando o ENEM como indicador de qualidade escolar

Detalhes bibliográficos
Autor(a) principal: SILVA FILHO, Rogério Luiz Cardoso
Data de Publicação: 2017
Tipo de documento: Tese
Idioma: por
Título da fonte: Repositório Institucional da UFPE
Texto Completo: https://repositorio.ufpe.br/handle/123456789/28008
Resumo: O Ensino Médio brasileiro vem, ao longo dos anos, passando por constantes debates acerca dos seus problemas de acesso e permanência, qualidade do ensino e ate mesmo da sua identidade. O crescimento da oferta da educação profissional integrada ao ensino médio protagonizada pelos Institutos Federais (IFs), criados em 2008, vem trazendo resultados interessantes diante dos grandes investimentos do Governo Federal. Dessa forma, novos mecanismos que subsidiem gestores no processo de tomada de decisão e na avaliação do binômio “oferta-qualidade” dessas instituições tornam-se cada vez mais necessários. Esta dissertação, considerando o papel avaliativo do Exame Nacional do Ensino Médio (ENEM), apresenta uma solução de mineração de dados em um processo de Knowledge Discovery in Databases (KDD) para predição e estimação do desempenho dos alunos do Ensino Médio dos IFs. Para a extração do conhecimento, foi utilizado o método baseado em etapas CRoss-Industry Standard Process for Data Mining (CRISP-DM) aliado as ideias do framework Domain-Driven Data Mining (D3M), visando a produção de resultados mais amigáveis aos especialistas do domínio. As bases de dados do ENEM e as do Censo escolar foram integradas para a formação de um data-mart apresentado no grao aluno. Apos a interpretação e modelagem do problema, os dados foram preparados para diferentes técnicas de Inteligência Artificial; inserindo, modificando, preenchendo e excluindo variáveis através de informações de contexto. A etapa de transformação contou ainda com um procedimento supervisionado de redução de dimensionalidade que considerou a taxa de valores ausentes, variância e a correlação entre as variáveis independentes. Na construção dos modelos, a técnica de regressão logística produziu índices de propensão de sucesso dos alunos e atingiu resultados superiores a 0,84 e 0,51 para as métricas AUC_ROC e KS2_MAX, respectivamente. Para a extração do conhecimento em linguagem natural, arvores de decisão construíram condições sequenciais e regras foram geradas por meio de indução baseada em escores. Essas técnicas foram avaliadas quanto as métricas: confiança, suporte e lift. Ao final, concluiu-se que a abordagem apresentada (Domain-Driven Data Mining) teve um ótimo resultado na modelagem e na validação de politicas publicas.
id UFPE_333ae4d398e0180add79b3060bd5eaab
oai_identifier_str oai:repositorio.ufpe.br:123456789/28008
network_acronym_str UFPE
network_name_str Repositório Institucional da UFPE
repository_id_str 2221
spelling SILVA FILHO, Rogério Luiz Cardosohttp://lattes.cnpq.br/9212443460705379http://lattes.cnpq.br/3524590211304012ADEODATO, Paulo Jorge Leitão2018-12-05T18:05:13Z2018-12-05T18:05:13Z2017-08-18https://repositorio.ufpe.br/handle/123456789/28008O Ensino Médio brasileiro vem, ao longo dos anos, passando por constantes debates acerca dos seus problemas de acesso e permanência, qualidade do ensino e ate mesmo da sua identidade. O crescimento da oferta da educação profissional integrada ao ensino médio protagonizada pelos Institutos Federais (IFs), criados em 2008, vem trazendo resultados interessantes diante dos grandes investimentos do Governo Federal. Dessa forma, novos mecanismos que subsidiem gestores no processo de tomada de decisão e na avaliação do binômio “oferta-qualidade” dessas instituições tornam-se cada vez mais necessários. Esta dissertação, considerando o papel avaliativo do Exame Nacional do Ensino Médio (ENEM), apresenta uma solução de mineração de dados em um processo de Knowledge Discovery in Databases (KDD) para predição e estimação do desempenho dos alunos do Ensino Médio dos IFs. Para a extração do conhecimento, foi utilizado o método baseado em etapas CRoss-Industry Standard Process for Data Mining (CRISP-DM) aliado as ideias do framework Domain-Driven Data Mining (D3M), visando a produção de resultados mais amigáveis aos especialistas do domínio. As bases de dados do ENEM e as do Censo escolar foram integradas para a formação de um data-mart apresentado no grao aluno. Apos a interpretação e modelagem do problema, os dados foram preparados para diferentes técnicas de Inteligência Artificial; inserindo, modificando, preenchendo e excluindo variáveis através de informações de contexto. A etapa de transformação contou ainda com um procedimento supervisionado de redução de dimensionalidade que considerou a taxa de valores ausentes, variância e a correlação entre as variáveis independentes. Na construção dos modelos, a técnica de regressão logística produziu índices de propensão de sucesso dos alunos e atingiu resultados superiores a 0,84 e 0,51 para as métricas AUC_ROC e KS2_MAX, respectivamente. Para a extração do conhecimento em linguagem natural, arvores de decisão construíram condições sequenciais e regras foram geradas por meio de indução baseada em escores. Essas técnicas foram avaliadas quanto as métricas: confiança, suporte e lift. Ao final, concluiu-se que a abordagem apresentada (Domain-Driven Data Mining) teve um ótimo resultado na modelagem e na validação de politicas publicas.Throughout the years, the Brazilian Secondary School has gone through constant debates about its problems of access and permanence, quality of teaching and even of its identity. The growth in the offer of vocational education integrated to secondary schools, starred by the Federal Institutes (IFs), created in 2008, has brought interesting results in view of the large investments of the Federal Government. Thus, new mechanisms that subsidize managers in the decision-making process and in the evaluation of the "supply-quality" binomial of these institutions become increasingly necessary. This dissertation, considering the evaluative role of Secondary School Student Test (ENEM), presents a data mining solution in a Knowledge Discovery in Databases (KDD) process for predicting and estimating the performance of secondary school students of IFs. For the extraction of knowledge, the CRoss-Industry Standard Process for Data Mining (CRISP-DM) method was used associated with the ideas of the Domain-Driven Data Mining (D3M) framework, in order to produce friendly results to domain experts. The ENEM and official school census databases were integrated into data-mart presented in student grain. After the interpretation and modeling of the problem, the data were prepared for different techniques of Artificial Intelligence; inserting, modifying, populating, and deleting variables through context information. The transformation stage also had a supervised procedure of dimensionality reduction that considered the rate of missing values, variance and the correlation between the independent variables. In the construction of the models, the logistic regression technique produced a propensity score for success of students and had your results higher than 0.84 and 0.51 for the metrics AUC_ROC and KS2_MAX, respectively. For the extraction of knowledge in natural language, decision trees constructed sequential conditions and rules were generated through induction based on scores. These techniques were evaluated for the metrics: confidence, support and lift. In the end, it was concluded that the approach presented (Domain-Driven Data Mining) had an excellent result in the modeling and the validation of public policies.porUniversidade Federal de PernambucoPrograma de Pos Graduacao em Ciencia da ComputacaoUFPEBrasilAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessMineração de dadosDesempenho escolarModelo de análise e predição do desempenho dos alunos dos Institutos Federais de Educação usando o ENEM como indicador de qualidade escolarinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisdoutoradoreponame:Repositório Institucional da UFPEinstname:Universidade Federal de Pernambuco (UFPE)instacron:UFPETHUMBNAILTESE Rogério Luiz Cardoso Silva Filho.pdf.jpgTESE Rogério Luiz Cardoso Silva Filho.pdf.jpgGenerated Thumbnailimage/jpeg1463https://repositorio.ufpe.br/bitstream/123456789/28008/5/TESE%20Rog%c3%a9rio%20Luiz%20Cardoso%20Silva%20Filho.pdf.jpg6202f0197975d86a54d042089e939289MD55ORIGINALTESE Rogério Luiz Cardoso Silva Filho.pdfTESE Rogério Luiz Cardoso Silva Filho.pdfapplication/pdf2418689https://repositorio.ufpe.br/bitstream/123456789/28008/1/TESE%20Rog%c3%a9rio%20Luiz%20Cardoso%20Silva%20Filho.pdf992139ec4b1f6920d47833efdb91defbMD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://repositorio.ufpe.br/bitstream/123456789/28008/2/license_rdfe39d27027a6cc9cb039ad269a5db8e34MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-82311https://repositorio.ufpe.br/bitstream/123456789/28008/3/license.txt4b8a02c7f2818eaf00dcf2260dd5eb08MD53TEXTTESE Rogério Luiz Cardoso Silva Filho.pdf.txtTESE Rogério Luiz Cardoso Silva Filho.pdf.txtExtracted texttext/plain144060https://repositorio.ufpe.br/bitstream/123456789/28008/4/TESE%20Rog%c3%a9rio%20Luiz%20Cardoso%20Silva%20Filho.pdf.txt7d62a422e8761472d1fae74af5b50ebcMD54123456789/280082019-10-25 09:48:47.961oai:repositorio.ufpe.br:123456789/28008TGljZW7Dp2EgZGUgRGlzdHJpYnVpw6fDo28gTsOjbyBFeGNsdXNpdmEKClRvZG8gZGVwb3NpdGFudGUgZGUgbWF0ZXJpYWwgbm8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgKFJJKSBkZXZlIGNvbmNlZGVyLCDDoCBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBQZXJuYW1idWNvIChVRlBFKSwgdW1hIExpY2Vuw6dhIGRlIERpc3RyaWJ1acOnw6NvIE7Do28gRXhjbHVzaXZhIHBhcmEgbWFudGVyIGUgdG9ybmFyIGFjZXNzw612ZWlzIG9zIHNldXMgZG9jdW1lbnRvcywgZW0gZm9ybWF0byBkaWdpdGFsLCBuZXN0ZSByZXBvc2l0w7NyaW8uCgpDb20gYSBjb25jZXNzw6NvIGRlc3RhIGxpY2Vuw6dhIG7Do28gZXhjbHVzaXZhLCBvIGRlcG9zaXRhbnRlIG1hbnTDqW0gdG9kb3Mgb3MgZGlyZWl0b3MgZGUgYXV0b3IuCl9fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fXwoKTGljZW7Dp2EgZGUgRGlzdHJpYnVpw6fDo28gTsOjbyBFeGNsdXNpdmEKCkFvIGNvbmNvcmRhciBjb20gZXN0YSBsaWNlbsOnYSBlIGFjZWl0w6EtbGEsIHZvY8OqIChhdXRvciBvdSBkZXRlbnRvciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMpOgoKYSkgRGVjbGFyYSBxdWUgY29uaGVjZSBhIHBvbMOtdGljYSBkZSBjb3B5cmlnaHQgZGEgZWRpdG9yYSBkbyBzZXUgZG9jdW1lbnRvOwpiKSBEZWNsYXJhIHF1ZSBjb25oZWNlIGUgYWNlaXRhIGFzIERpcmV0cml6ZXMgcGFyYSBvIFJlcG9zaXTDs3JpbyBJbnN0aXR1Y2lvbmFsIGRhIFVGUEU7CmMpIENvbmNlZGUgw6AgVUZQRSBvIGRpcmVpdG8gbsOjbyBleGNsdXNpdm8gZGUgYXJxdWl2YXIsIHJlcHJvZHV6aXIsIGNvbnZlcnRlciAoY29tbyBkZWZpbmlkbyBhIHNlZ3VpciksIGNvbXVuaWNhciBlL291IGRpc3RyaWJ1aXIsIG5vIFJJLCBvIGRvY3VtZW50byBlbnRyZWd1ZSAoaW5jbHVpbmRvIG8gcmVzdW1vL2Fic3RyYWN0KSBlbSBmb3JtYXRvIGRpZ2l0YWwgb3UgcG9yIG91dHJvIG1laW87CmQpIERlY2xhcmEgcXVlIGF1dG9yaXphIGEgVUZQRSBhIGFycXVpdmFyIG1haXMgZGUgdW1hIGPDs3BpYSBkZXN0ZSBkb2N1bWVudG8gZSBjb252ZXJ0w6otbG8sIHNlbSBhbHRlcmFyIG8gc2V1IGNvbnRlw7pkbywgcGFyYSBxdWFscXVlciBmb3JtYXRvIGRlIGZpY2hlaXJvLCBtZWlvIG91IHN1cG9ydGUsIHBhcmEgZWZlaXRvcyBkZSBzZWd1cmFuw6dhLCBwcmVzZXJ2YcOnw6NvIChiYWNrdXApIGUgYWNlc3NvOwplKSBEZWNsYXJhIHF1ZSBvIGRvY3VtZW50byBzdWJtZXRpZG8gw6kgbyBzZXUgdHJhYmFsaG8gb3JpZ2luYWwgZSBxdWUgZGV0w6ltIG8gZGlyZWl0byBkZSBjb25jZWRlciBhIHRlcmNlaXJvcyBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4gRGVjbGFyYSB0YW1iw6ltIHF1ZSBhIGVudHJlZ2EgZG8gZG9jdW1lbnRvIG7Do28gaW5mcmluZ2Ugb3MgZGlyZWl0b3MgZGUgb3V0cmEgcGVzc29hIG91IGVudGlkYWRlOwpmKSBEZWNsYXJhIHF1ZSwgbm8gY2FzbyBkbyBkb2N1bWVudG8gc3VibWV0aWRvIGNvbnRlciBtYXRlcmlhbCBkbyBxdWFsIG7Do28gZGV0w6ltIG9zIGRpcmVpdG9zIGRlCmF1dG9yLCBvYnRldmUgYSBhdXRvcml6YcOnw6NvIGlycmVzdHJpdGEgZG8gcmVzcGVjdGl2byBkZXRlbnRvciBkZXNzZXMgZGlyZWl0b3MgcGFyYSBjZWRlciDDoApVRlBFIG9zIGRpcmVpdG9zIHJlcXVlcmlkb3MgcG9yIGVzdGEgTGljZW7Dp2EgZSBhdXRvcml6YXIgYSB1bml2ZXJzaWRhZGUgYSB1dGlsaXrDoS1sb3MgbGVnYWxtZW50ZS4gRGVjbGFyYSB0YW1iw6ltIHF1ZSBlc3NlIG1hdGVyaWFsIGN1am9zIGRpcmVpdG9zIHPDo28gZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3UgY29udGXDumRvIGRvIGRvY3VtZW50byBlbnRyZWd1ZTsKZykgU2UgbyBkb2N1bWVudG8gZW50cmVndWUgw6kgYmFzZWFkbyBlbSB0cmFiYWxobyBmaW5hbmNpYWRvIG91IGFwb2lhZG8gcG9yIG91dHJhIGluc3RpdHVpw6fDo28gcXVlIG7Do28gYSBVRlBFLMKgZGVjbGFyYSBxdWUgY3VtcHJpdSBxdWFpc3F1ZXIgb2JyaWdhw6fDtWVzIGV4aWdpZGFzIHBlbG8gcmVzcGVjdGl2byBjb250cmF0byBvdSBhY29yZG8uCgpBIFVGUEUgaWRlbnRpZmljYXLDoSBjbGFyYW1lbnRlIG8ocykgbm9tZShzKSBkbyhzKSBhdXRvciAoZXMpIGRvcyBkaXJlaXRvcyBkbyBkb2N1bWVudG8gZW50cmVndWUgZSBuw6NvIGZhcsOhIHF1YWxxdWVyIGFsdGVyYcOnw6NvLCBwYXJhIGFsw6ltIGRvIHByZXZpc3RvIG5hIGFsw61uZWEgYykuCg==Repositório InstitucionalPUBhttps://repositorio.ufpe.br/oai/requestattena@ufpe.bropendoar:22212019-10-25T12:48:47Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)false
dc.title.pt_BR.fl_str_mv Modelo de análise e predição do desempenho dos alunos dos Institutos Federais de Educação usando o ENEM como indicador de qualidade escolar
title Modelo de análise e predição do desempenho dos alunos dos Institutos Federais de Educação usando o ENEM como indicador de qualidade escolar
spellingShingle Modelo de análise e predição do desempenho dos alunos dos Institutos Federais de Educação usando o ENEM como indicador de qualidade escolar
SILVA FILHO, Rogério Luiz Cardoso
Mineração de dados
Desempenho escolar
title_short Modelo de análise e predição do desempenho dos alunos dos Institutos Federais de Educação usando o ENEM como indicador de qualidade escolar
title_full Modelo de análise e predição do desempenho dos alunos dos Institutos Federais de Educação usando o ENEM como indicador de qualidade escolar
title_fullStr Modelo de análise e predição do desempenho dos alunos dos Institutos Federais de Educação usando o ENEM como indicador de qualidade escolar
title_full_unstemmed Modelo de análise e predição do desempenho dos alunos dos Institutos Federais de Educação usando o ENEM como indicador de qualidade escolar
title_sort Modelo de análise e predição do desempenho dos alunos dos Institutos Federais de Educação usando o ENEM como indicador de qualidade escolar
author SILVA FILHO, Rogério Luiz Cardoso
author_facet SILVA FILHO, Rogério Luiz Cardoso
author_role author
dc.contributor.authorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/9212443460705379
dc.contributor.advisorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/3524590211304012
dc.contributor.author.fl_str_mv SILVA FILHO, Rogério Luiz Cardoso
dc.contributor.advisor1.fl_str_mv ADEODATO, Paulo Jorge Leitão
contributor_str_mv ADEODATO, Paulo Jorge Leitão
dc.subject.por.fl_str_mv Mineração de dados
Desempenho escolar
topic Mineração de dados
Desempenho escolar
description O Ensino Médio brasileiro vem, ao longo dos anos, passando por constantes debates acerca dos seus problemas de acesso e permanência, qualidade do ensino e ate mesmo da sua identidade. O crescimento da oferta da educação profissional integrada ao ensino médio protagonizada pelos Institutos Federais (IFs), criados em 2008, vem trazendo resultados interessantes diante dos grandes investimentos do Governo Federal. Dessa forma, novos mecanismos que subsidiem gestores no processo de tomada de decisão e na avaliação do binômio “oferta-qualidade” dessas instituições tornam-se cada vez mais necessários. Esta dissertação, considerando o papel avaliativo do Exame Nacional do Ensino Médio (ENEM), apresenta uma solução de mineração de dados em um processo de Knowledge Discovery in Databases (KDD) para predição e estimação do desempenho dos alunos do Ensino Médio dos IFs. Para a extração do conhecimento, foi utilizado o método baseado em etapas CRoss-Industry Standard Process for Data Mining (CRISP-DM) aliado as ideias do framework Domain-Driven Data Mining (D3M), visando a produção de resultados mais amigáveis aos especialistas do domínio. As bases de dados do ENEM e as do Censo escolar foram integradas para a formação de um data-mart apresentado no grao aluno. Apos a interpretação e modelagem do problema, os dados foram preparados para diferentes técnicas de Inteligência Artificial; inserindo, modificando, preenchendo e excluindo variáveis através de informações de contexto. A etapa de transformação contou ainda com um procedimento supervisionado de redução de dimensionalidade que considerou a taxa de valores ausentes, variância e a correlação entre as variáveis independentes. Na construção dos modelos, a técnica de regressão logística produziu índices de propensão de sucesso dos alunos e atingiu resultados superiores a 0,84 e 0,51 para as métricas AUC_ROC e KS2_MAX, respectivamente. Para a extração do conhecimento em linguagem natural, arvores de decisão construíram condições sequenciais e regras foram geradas por meio de indução baseada em escores. Essas técnicas foram avaliadas quanto as métricas: confiança, suporte e lift. Ao final, concluiu-se que a abordagem apresentada (Domain-Driven Data Mining) teve um ótimo resultado na modelagem e na validação de politicas publicas.
publishDate 2017
dc.date.issued.fl_str_mv 2017-08-18
dc.date.accessioned.fl_str_mv 2018-12-05T18:05:13Z
dc.date.available.fl_str_mv 2018-12-05T18:05:13Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.ufpe.br/handle/123456789/28008
url https://repositorio.ufpe.br/handle/123456789/28008
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Pernambuco
dc.publisher.program.fl_str_mv Programa de Pos Graduacao em Ciencia da Computacao
dc.publisher.initials.fl_str_mv UFPE
dc.publisher.country.fl_str_mv Brasil
publisher.none.fl_str_mv Universidade Federal de Pernambuco
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPE
instname:Universidade Federal de Pernambuco (UFPE)
instacron:UFPE
instname_str Universidade Federal de Pernambuco (UFPE)
instacron_str UFPE
institution UFPE
reponame_str Repositório Institucional da UFPE
collection Repositório Institucional da UFPE
bitstream.url.fl_str_mv https://repositorio.ufpe.br/bitstream/123456789/28008/5/TESE%20Rog%c3%a9rio%20Luiz%20Cardoso%20Silva%20Filho.pdf.jpg
https://repositorio.ufpe.br/bitstream/123456789/28008/1/TESE%20Rog%c3%a9rio%20Luiz%20Cardoso%20Silva%20Filho.pdf
https://repositorio.ufpe.br/bitstream/123456789/28008/2/license_rdf
https://repositorio.ufpe.br/bitstream/123456789/28008/3/license.txt
https://repositorio.ufpe.br/bitstream/123456789/28008/4/TESE%20Rog%c3%a9rio%20Luiz%20Cardoso%20Silva%20Filho.pdf.txt
bitstream.checksum.fl_str_mv 6202f0197975d86a54d042089e939289
992139ec4b1f6920d47833efdb91defb
e39d27027a6cc9cb039ad269a5db8e34
4b8a02c7f2818eaf00dcf2260dd5eb08
7d62a422e8761472d1fae74af5b50ebc
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)
repository.mail.fl_str_mv attena@ufpe.br
_version_ 1793515756241027072