Os Algoritmos C4.5 e Hoeffding Tree Aplicados a Mineração de Dados Educacionais Referente ao Exame Nacional de Desempenho de Estudante (ENADE) em Ciência da Computação

Detalhes bibliográficos
Autor(a) principal: Amaro, Euclides Francisco António
Data de Publicação: 2019
Idioma: por
Título da fonte: Repositório Institucional da UNESC
Texto Completo: http://repositorio.unesc.net/handle/1/8203
Resumo: Trabalho de Conclusão de Curso, apresentado para obtenção do grau de Bacharel no Curso de Ciência da Computação da Universidade do Extremo Sul Catarinense, UNESC.
id UNESC-1_bfc19460c8ca404ffc3a547dd1746bda
oai_identifier_str oai:repositorio.unesc.net:1/8203
network_acronym_str UNESC-1
network_name_str Repositório Institucional da UNESC
spelling Amaro, Euclides Francisco AntónioGarcia, Merisandra Côrtes de MattosUniversidade do Extremo Sul Catarinense2021-05-11T17:16:04Z2021-05-11T17:16:04Z2019-12http://repositorio.unesc.net/handle/1/8203Trabalho de Conclusão de Curso, apresentado para obtenção do grau de Bacharel no Curso de Ciência da Computação da Universidade do Extremo Sul Catarinense, UNESC.Ao decorrer da globalização e a alta demanda de informações, surgiu-se a necessidade de armazenamento das mesmas. A partir deste contexto, observa-se o data science, que compreende as etapas pertinentes à limpeza, elaboração e análise de dados com mecanismos aplicados a fim de se extrair dados e obter intuições por meio de informações da base de dados. O Exame Nacional de Avaliação do Estudante (ENADE) tem como objetivo avaliar o grau dos conhecimentos dos estudantes, referentes aos conteúdos programáticos previstos nas diretrizes curriculares de seus respectivos cursos, a partir do desempenho individual destes no Exame. Nesta pesquisa realizou-se mineração de dados educacionais por meio da tarefa de classificação, a partir do método de indução de árvores de decisão, empregando-se os algoritmos C4,5 e Hoeffding Tree. Os dados estudados foram extraídos do ENADE do Curso de Ciência da Computação das três bases: Universidade do Extremo Sul Catarinense, Associação Catarinense das Fundações Educacionais e Santa Catarina. A base de dados analisada encontra-se disponível no site do Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira e possui dados referentes às provas da área de Ciência da Computação dos anos de 2011, 2014 e 2017. Após a execução da mineração de dados dos modelos obtidos, estes foram analisados por meio das medidas de qualidade, como a acurácia, a fim de se identificar qual dos dois algoritmos gerou o melhor modelo. A base que se destaca com o classificador que tem o melhor resultado é a base da Universidade do Extremo Sul Catarinense com o algoritmo C4.5 e valor da acurácia 98,79.Exame Nacional de Desempenho de Estudante (ENADE)Data ScienceMineração de dadosAlgoritmo C4.5Algoritmo Hoeffding TreeOs Algoritmos C4.5 e Hoeffding Tree Aplicados a Mineração de Dados Educacionais Referente ao Exame Nacional de Desempenho de Estudante (ENADE) em Ciência da Computaçãoinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisporreponame:Repositório Institucional da UNESCinstname:Universidade do Extremo Sul Catarinense (Unesc)instacron:UNESCinfo:eu-repo/semantics/openAccessORIGINALEUCLIDES FRANCISCO ANTONIO.pdfEUCLIDES FRANCISCO ANTONIO.pdfTCCapplication/pdf3691042http://repositorio.unesc.net/bitstream/1/8203/1/EUCLIDES%20FRANCISCO%20ANTONIO.pdfc401c5e53955bf2be670e877bd752e25MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81748http://repositorio.unesc.net/bitstream/1/8203/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD521/82032021-05-11 14:16:07.818Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório de Publicaçõeshttp://repositorio.unesc.net/
dc.title.pt_BR.fl_str_mv Os Algoritmos C4.5 e Hoeffding Tree Aplicados a Mineração de Dados Educacionais Referente ao Exame Nacional de Desempenho de Estudante (ENADE) em Ciência da Computação
title Os Algoritmos C4.5 e Hoeffding Tree Aplicados a Mineração de Dados Educacionais Referente ao Exame Nacional de Desempenho de Estudante (ENADE) em Ciência da Computação
spellingShingle Os Algoritmos C4.5 e Hoeffding Tree Aplicados a Mineração de Dados Educacionais Referente ao Exame Nacional de Desempenho de Estudante (ENADE) em Ciência da Computação
Amaro, Euclides Francisco António
Exame Nacional de Desempenho de Estudante (ENADE)
Data Science
Mineração de dados
Algoritmo C4.5
Algoritmo Hoeffding Tree
title_short Os Algoritmos C4.5 e Hoeffding Tree Aplicados a Mineração de Dados Educacionais Referente ao Exame Nacional de Desempenho de Estudante (ENADE) em Ciência da Computação
title_full Os Algoritmos C4.5 e Hoeffding Tree Aplicados a Mineração de Dados Educacionais Referente ao Exame Nacional de Desempenho de Estudante (ENADE) em Ciência da Computação
title_fullStr Os Algoritmos C4.5 e Hoeffding Tree Aplicados a Mineração de Dados Educacionais Referente ao Exame Nacional de Desempenho de Estudante (ENADE) em Ciência da Computação
title_full_unstemmed Os Algoritmos C4.5 e Hoeffding Tree Aplicados a Mineração de Dados Educacionais Referente ao Exame Nacional de Desempenho de Estudante (ENADE) em Ciência da Computação
title_sort Os Algoritmos C4.5 e Hoeffding Tree Aplicados a Mineração de Dados Educacionais Referente ao Exame Nacional de Desempenho de Estudante (ENADE) em Ciência da Computação
author Amaro, Euclides Francisco António
author_facet Amaro, Euclides Francisco António
author_role author
dc.contributor.author.fl_str_mv Amaro, Euclides Francisco António
dc.contributor.advisor1.fl_str_mv Garcia, Merisandra Côrtes de Mattos
contributor_str_mv Garcia, Merisandra Côrtes de Mattos
dc.subject.por.fl_str_mv Exame Nacional de Desempenho de Estudante (ENADE)
Data Science
Mineração de dados
Algoritmo C4.5
Algoritmo Hoeffding Tree
topic Exame Nacional de Desempenho de Estudante (ENADE)
Data Science
Mineração de dados
Algoritmo C4.5
Algoritmo Hoeffding Tree
dc.description.pt_BR.fl_txt_mv Trabalho de Conclusão de Curso, apresentado para obtenção do grau de Bacharel no Curso de Ciência da Computação da Universidade do Extremo Sul Catarinense, UNESC.
dc.description.abstract.por.fl_txt_mv Ao decorrer da globalização e a alta demanda de informações, surgiu-se a necessidade de armazenamento das mesmas. A partir deste contexto, observa-se o data science, que compreende as etapas pertinentes à limpeza, elaboração e análise de dados com mecanismos aplicados a fim de se extrair dados e obter intuições por meio de informações da base de dados. O Exame Nacional de Avaliação do Estudante (ENADE) tem como objetivo avaliar o grau dos conhecimentos dos estudantes, referentes aos conteúdos programáticos previstos nas diretrizes curriculares de seus respectivos cursos, a partir do desempenho individual destes no Exame. Nesta pesquisa realizou-se mineração de dados educacionais por meio da tarefa de classificação, a partir do método de indução de árvores de decisão, empregando-se os algoritmos C4,5 e Hoeffding Tree. Os dados estudados foram extraídos do ENADE do Curso de Ciência da Computação das três bases: Universidade do Extremo Sul Catarinense, Associação Catarinense das Fundações Educacionais e Santa Catarina. A base de dados analisada encontra-se disponível no site do Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira e possui dados referentes às provas da área de Ciência da Computação dos anos de 2011, 2014 e 2017. Após a execução da mineração de dados dos modelos obtidos, estes foram analisados por meio das medidas de qualidade, como a acurácia, a fim de se identificar qual dos dois algoritmos gerou o melhor modelo. A base que se destaca com o classificador que tem o melhor resultado é a base da Universidade do Extremo Sul Catarinense com o algoritmo C4.5 e valor da acurácia 98,79.
description Trabalho de Conclusão de Curso, apresentado para obtenção do grau de Bacharel no Curso de Ciência da Computação da Universidade do Extremo Sul Catarinense, UNESC.
publishDate 2019
dc.date.created.fl_str_mv 2019-12
dc.date.accessioned.fl_str_mv 2021-05-11T17:16:04Z
dc.date.available.fl_str_mv 2021-05-11T17:16:04Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://repositorio.unesc.net/handle/1/8203
url http://repositorio.unesc.net/handle/1/8203
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.coverage.spatial.pt_BR.fl_str_mv Universidade do Extremo Sul Catarinense
dc.source.none.fl_str_mv reponame:Repositório Institucional da UNESC
instname:Universidade do Extremo Sul Catarinense (Unesc)
instacron:UNESC
instname_str Universidade do Extremo Sul Catarinense (Unesc)
instacron_str UNESC
institution UNESC
reponame_str Repositório Institucional da UNESC
collection Repositório Institucional da UNESC
bitstream.url.fl_str_mv http://repositorio.unesc.net/bitstream/1/8203/1/EUCLIDES%20FRANCISCO%20ANTONIO.pdf
http://repositorio.unesc.net/bitstream/1/8203/2/license.txt
bitstream.checksum.fl_str_mv c401c5e53955bf2be670e877bd752e25
8a4605be74aa9ea9d79846c1fba20a33
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv
repository.mail.fl_str_mv
_version_ 1725763288928616448