Análise de agrupamento pelos métodos hierárquico aglomerativo e particional fuzzy utilizados para educational data mining em dados de educação a distância

Detalhes bibliográficos
Autor(a) principal: Eyng, Alini Marangoni
Data de Publicação: 2019
Idioma: por
Título da fonte: Repositório Institucional da UNESC
Texto Completo: http://repositorio.unesc.net/handle/1/8174
Resumo: Trabalho de Conclusão de Curso, apresentado para obtenção do grau de Bacharel no Curso de Ciência da Computação da Universidade do Extremo Sul Catarinense, UNESC.
id UNESC-1_b7b635526964d74ae9780585f8fe01ea
oai_identifier_str oai:repositorio.unesc.net:1/8174
network_acronym_str UNESC-1
network_name_str Repositório Institucional da UNESC
spelling Eyng, Alini MarangoniGarcia, Merisandra Côrtes de MattosUniversidade do Extremo Sul Catarinense2021-05-06T21:38:01Z2021-05-06T21:38:01Z2019-07http://repositorio.unesc.net/handle/1/8174Trabalho de Conclusão de Curso, apresentado para obtenção do grau de Bacharel no Curso de Ciência da Computação da Universidade do Extremo Sul Catarinense, UNESC.O crescimento da tecnologia, faz com que a quantidade de dados em repositórios aumente, impossibilitando a análise por métodos tradicionais, surgindo à mineração de dados, aplicada por meio da descoberta de conhecimento. A educação gera dados relacionados a alunos, principalmente a educação à distância em que os dados são provenientes de um ambiente virtual de aprendizagem, se tornando uma área de interesse dos pesquisadores educacionais. Com isso, surge o educational data mining, que utiliza métodos da mineração de dados. Mediante as técnicas e tarefas de mineração, tem o agrupamento, que é dividido em agrupamento hierárquico aglomerativo e agrupamento particional. De modo que nesta pesquisa é realizada a comparação entre o algoritmo de AGNES para o agrupamento hierárquico aglomerativo e o algoritmo fuzzy c-means para o agrupamento particional, com o objetivo de identificar qual dos métodos possui melhor desempenho em dados educacionais. Os dados são provenientes da disciplina ministrada a distância de Introdução a Engenharia de Segurança do Trabalho, na Universidade do Extremo Sul Catarinense. A ferramenta R foi usada, por ser um software livre, para implementação dos algoritmos e métodos de validação. Ao iniciar a mineração, é necessário definir a distância da matriz de similaridade, em que é aplicado as distâncias manhattan e euclidiana em AGNES e manhattan, euclidiana, correlattion e seuclidean no fuzzy c-means. O algoritmo AGNES, precisa da identificação do método de conexão, para gerar os resultados, sendo aplicado teste com os métodos de ward, distância média, maior distância e menor distância. A verificação dos resultados apresentados pelos algoritmos é realizada por meio das medidas de qualidade, aplicando índices de validação. O modelo final definido para fuzzy c-means, foi o que aplica a matriz de similaridade seuclidean e para o AGNES o que tem a matriz de similaridade de manhattan, pelo método de conexão distância média. Comparando o resultado gerado pelo índice de silhouette, o agrupamento particional, foi definido como modelo final de agrupamento sobre os dados educacionais.Educação a distânciaEducational data miningDescoberta de conhecimentoAgrupamento hierárquico aglomerativoAgrupamento particionalAnálise de agrupamento pelos métodos hierárquico aglomerativo e particional fuzzy utilizados para educational data mining em dados de educação a distânciainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisporreponame:Repositório Institucional da UNESCinstname:Universidade do Extremo Sul Catarinense (Unesc)instacron:UNESCinfo:eu-repo/semantics/openAccessORIGINALALINI MARANGONI EYNG.pdfALINI MARANGONI EYNG.pdfTCCapplication/pdf3333130http://repositorio.unesc.net/bitstream/1/8174/1/ALINI%20MARANGONI%20EYNG.pdffd596a532f806f5aa97ad17e204b6f51MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81748http://repositorio.unesc.net/bitstream/1/8174/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD521/81742021-05-06 18:38:04.683Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório de Publicaçõeshttp://repositorio.unesc.net/
dc.title.pt_BR.fl_str_mv Análise de agrupamento pelos métodos hierárquico aglomerativo e particional fuzzy utilizados para educational data mining em dados de educação a distância
title Análise de agrupamento pelos métodos hierárquico aglomerativo e particional fuzzy utilizados para educational data mining em dados de educação a distância
spellingShingle Análise de agrupamento pelos métodos hierárquico aglomerativo e particional fuzzy utilizados para educational data mining em dados de educação a distância
Eyng, Alini Marangoni
Educação a distância
Educational data mining
Descoberta de conhecimento
Agrupamento hierárquico aglomerativo
Agrupamento particional
title_short Análise de agrupamento pelos métodos hierárquico aglomerativo e particional fuzzy utilizados para educational data mining em dados de educação a distância
title_full Análise de agrupamento pelos métodos hierárquico aglomerativo e particional fuzzy utilizados para educational data mining em dados de educação a distância
title_fullStr Análise de agrupamento pelos métodos hierárquico aglomerativo e particional fuzzy utilizados para educational data mining em dados de educação a distância
title_full_unstemmed Análise de agrupamento pelos métodos hierárquico aglomerativo e particional fuzzy utilizados para educational data mining em dados de educação a distância
title_sort Análise de agrupamento pelos métodos hierárquico aglomerativo e particional fuzzy utilizados para educational data mining em dados de educação a distância
author Eyng, Alini Marangoni
author_facet Eyng, Alini Marangoni
author_role author
dc.contributor.author.fl_str_mv Eyng, Alini Marangoni
dc.contributor.advisor1.fl_str_mv Garcia, Merisandra Côrtes de Mattos
contributor_str_mv Garcia, Merisandra Côrtes de Mattos
dc.subject.por.fl_str_mv Educação a distância
Educational data mining
Descoberta de conhecimento
Agrupamento hierárquico aglomerativo
Agrupamento particional
topic Educação a distância
Educational data mining
Descoberta de conhecimento
Agrupamento hierárquico aglomerativo
Agrupamento particional
dc.description.pt_BR.fl_txt_mv Trabalho de Conclusão de Curso, apresentado para obtenção do grau de Bacharel no Curso de Ciência da Computação da Universidade do Extremo Sul Catarinense, UNESC.
dc.description.abstract.por.fl_txt_mv O crescimento da tecnologia, faz com que a quantidade de dados em repositórios aumente, impossibilitando a análise por métodos tradicionais, surgindo à mineração de dados, aplicada por meio da descoberta de conhecimento. A educação gera dados relacionados a alunos, principalmente a educação à distância em que os dados são provenientes de um ambiente virtual de aprendizagem, se tornando uma área de interesse dos pesquisadores educacionais. Com isso, surge o educational data mining, que utiliza métodos da mineração de dados. Mediante as técnicas e tarefas de mineração, tem o agrupamento, que é dividido em agrupamento hierárquico aglomerativo e agrupamento particional. De modo que nesta pesquisa é realizada a comparação entre o algoritmo de AGNES para o agrupamento hierárquico aglomerativo e o algoritmo fuzzy c-means para o agrupamento particional, com o objetivo de identificar qual dos métodos possui melhor desempenho em dados educacionais. Os dados são provenientes da disciplina ministrada a distância de Introdução a Engenharia de Segurança do Trabalho, na Universidade do Extremo Sul Catarinense. A ferramenta R foi usada, por ser um software livre, para implementação dos algoritmos e métodos de validação. Ao iniciar a mineração, é necessário definir a distância da matriz de similaridade, em que é aplicado as distâncias manhattan e euclidiana em AGNES e manhattan, euclidiana, correlattion e seuclidean no fuzzy c-means. O algoritmo AGNES, precisa da identificação do método de conexão, para gerar os resultados, sendo aplicado teste com os métodos de ward, distância média, maior distância e menor distância. A verificação dos resultados apresentados pelos algoritmos é realizada por meio das medidas de qualidade, aplicando índices de validação. O modelo final definido para fuzzy c-means, foi o que aplica a matriz de similaridade seuclidean e para o AGNES o que tem a matriz de similaridade de manhattan, pelo método de conexão distância média. Comparando o resultado gerado pelo índice de silhouette, o agrupamento particional, foi definido como modelo final de agrupamento sobre os dados educacionais.
description Trabalho de Conclusão de Curso, apresentado para obtenção do grau de Bacharel no Curso de Ciência da Computação da Universidade do Extremo Sul Catarinense, UNESC.
publishDate 2019
dc.date.created.fl_str_mv 2019-07
dc.date.accessioned.fl_str_mv 2021-05-06T21:38:01Z
dc.date.available.fl_str_mv 2021-05-06T21:38:01Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://repositorio.unesc.net/handle/1/8174
url http://repositorio.unesc.net/handle/1/8174
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.coverage.spatial.pt_BR.fl_str_mv Universidade do Extremo Sul Catarinense
dc.source.none.fl_str_mv reponame:Repositório Institucional da UNESC
instname:Universidade do Extremo Sul Catarinense (Unesc)
instacron:UNESC
instname_str Universidade do Extremo Sul Catarinense (Unesc)
instacron_str UNESC
institution UNESC
reponame_str Repositório Institucional da UNESC
collection Repositório Institucional da UNESC
bitstream.url.fl_str_mv http://repositorio.unesc.net/bitstream/1/8174/1/ALINI%20MARANGONI%20EYNG.pdf
http://repositorio.unesc.net/bitstream/1/8174/2/license.txt
bitstream.checksum.fl_str_mv fd596a532f806f5aa97ad17e204b6f51
8a4605be74aa9ea9d79846c1fba20a33
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv
repository.mail.fl_str_mv
_version_ 1725763290634649600