Sistema de recomendação de textos acadêmicos através de clusterização com k-Means iterativo

Detalhes bibliográficos
Autor(a) principal: Skinner, Rafael de Araujo
Data de Publicação: 2019
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da Universidade Federal Fluminense (RIUFF)
Texto Completo: http://app.uff.br/riuff/handle/1/25785
Resumo: Este trabalho emprega uma técnica de aprendizado não supervisionada para a criação de clusters de artigos semelhantes da base de dados da Sociedade Brasileira de Computação (SBC), que utiliza o popular algoritmo k-Means. Mais, especificamente, é feito um processo iterativo na execução do k-Means, onde o número de clusters k é determinado de maneira incremental, começando com k assumindo o valor um e incrementando-o a cada iteração sem sucesso. Posteriormente, recomeçando o processo quando for encontrado algum cluster com tamanho dentro do limite especificado. Dessa forma, a escolha de k é substituída pela escolha do tamanho máximo dos clusters finais, obtendo-se clusters com tamanhos controlados, idealmente pouco discrepantes e, ainda, eliminando a difícil escolha do k. Tendo em vista que nem sempre é claro qual o melhor valor a ser definido e, usualmente, a escolha é feita baseada em conhecimento prévio do conjunto, de suposições ou de experiência prática, segundo Hamerly e Elkan (1)
id UFF-2_d6088b802ebda462be1d7e8bbd9c8344
oai_identifier_str oai:app.uff.br:1/25785
network_acronym_str UFF-2
network_name_str Repositório Institucional da Universidade Federal Fluminense (RIUFF)
repository_id_str 2120
spelling Sistema de recomendação de textos acadêmicos através de clusterização com k-Means iterativoClustersClusterizaçãoTextos acadêmicosSistema de recomendaçãoAnálise de agrupamentoSistema de recomendaçãoAlgoritmo computacionalClusterizationk-MeansAcademic textsRecommender systemsEste trabalho emprega uma técnica de aprendizado não supervisionada para a criação de clusters de artigos semelhantes da base de dados da Sociedade Brasileira de Computação (SBC), que utiliza o popular algoritmo k-Means. Mais, especificamente, é feito um processo iterativo na execução do k-Means, onde o número de clusters k é determinado de maneira incremental, começando com k assumindo o valor um e incrementando-o a cada iteração sem sucesso. Posteriormente, recomeçando o processo quando for encontrado algum cluster com tamanho dentro do limite especificado. Dessa forma, a escolha de k é substituída pela escolha do tamanho máximo dos clusters finais, obtendo-se clusters com tamanhos controlados, idealmente pouco discrepantes e, ainda, eliminando a difícil escolha do k. Tendo em vista que nem sempre é claro qual o melhor valor a ser definido e, usualmente, a escolha é feita baseada em conhecimento prévio do conjunto, de suposições ou de experiência prática, segundo Hamerly e Elkan (1)This work employs an unsupervised learning technique for clustering similar articles from the Brazilian Computer Society database, using the popular k-Means algorithm. More specifically, an iterative process is performed in the execution of k-Means, where the number of clusters k is incrementally determined, starting with k assuming the value of one and incrementing it with each unsuccessful iteration and then, restarting the process when any cluster with a size up to the specified limit is found. Thus, the choice of k is replaced by the choice of the maximum size of the final clusters, resulting in clusters with controlled sizes, ideally little discrepant, and eliminating the difficult choice of k. Given that it is not always clear what is the best value to define and, usually, the choice is made based on prior knowledge of the set, assumptions or practical experience according to Hamerly and Elkan.62 p.Filho, José ViterboMiranda, Leandro Botelho Alves deBernardini, Flávia CristinaSampaio, Igor Garcia BalhausenSkinner, Rafael de Araujo2022-07-21T12:03:02Z2022-07-21T12:03:02Z2019info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfSKINNER, Rafael de Araujo. Sistema de recomendação de textos acadêmicos através de clusterização com k-Means iterativo. 2019. 62 f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) - Universidade Federal Fluminense, Instituto de Computação, Niterói, 2019http://app.uff.br/riuff/handle/1/25785CC-BY-SAinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF)instname:Universidade Federal Fluminense (UFF)instacron:UFF2022-07-21T12:03:35Zoai:app.uff.br:1/25785Repositório InstitucionalPUBhttps://app.uff.br/oai/requestriuff@id.uff.bropendoar:21202022-07-21T12:03:35Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF)false
dc.title.none.fl_str_mv Sistema de recomendação de textos acadêmicos através de clusterização com k-Means iterativo
title Sistema de recomendação de textos acadêmicos através de clusterização com k-Means iterativo
spellingShingle Sistema de recomendação de textos acadêmicos através de clusterização com k-Means iterativo
Skinner, Rafael de Araujo
Clusters
Clusterização
Textos acadêmicos
Sistema de recomendação
Análise de agrupamento
Sistema de recomendação
Algoritmo computacional
Clusterization
k-Means
Academic texts
Recommender systems
title_short Sistema de recomendação de textos acadêmicos através de clusterização com k-Means iterativo
title_full Sistema de recomendação de textos acadêmicos através de clusterização com k-Means iterativo
title_fullStr Sistema de recomendação de textos acadêmicos através de clusterização com k-Means iterativo
title_full_unstemmed Sistema de recomendação de textos acadêmicos através de clusterização com k-Means iterativo
title_sort Sistema de recomendação de textos acadêmicos através de clusterização com k-Means iterativo
author Skinner, Rafael de Araujo
author_facet Skinner, Rafael de Araujo
author_role author
dc.contributor.none.fl_str_mv Filho, José Viterbo
Miranda, Leandro Botelho Alves de
Bernardini, Flávia Cristina
Sampaio, Igor Garcia Balhausen
dc.contributor.author.fl_str_mv Skinner, Rafael de Araujo
dc.subject.por.fl_str_mv Clusters
Clusterização
Textos acadêmicos
Sistema de recomendação
Análise de agrupamento
Sistema de recomendação
Algoritmo computacional
Clusterization
k-Means
Academic texts
Recommender systems
topic Clusters
Clusterização
Textos acadêmicos
Sistema de recomendação
Análise de agrupamento
Sistema de recomendação
Algoritmo computacional
Clusterization
k-Means
Academic texts
Recommender systems
description Este trabalho emprega uma técnica de aprendizado não supervisionada para a criação de clusters de artigos semelhantes da base de dados da Sociedade Brasileira de Computação (SBC), que utiliza o popular algoritmo k-Means. Mais, especificamente, é feito um processo iterativo na execução do k-Means, onde o número de clusters k é determinado de maneira incremental, começando com k assumindo o valor um e incrementando-o a cada iteração sem sucesso. Posteriormente, recomeçando o processo quando for encontrado algum cluster com tamanho dentro do limite especificado. Dessa forma, a escolha de k é substituída pela escolha do tamanho máximo dos clusters finais, obtendo-se clusters com tamanhos controlados, idealmente pouco discrepantes e, ainda, eliminando a difícil escolha do k. Tendo em vista que nem sempre é claro qual o melhor valor a ser definido e, usualmente, a escolha é feita baseada em conhecimento prévio do conjunto, de suposições ou de experiência prática, segundo Hamerly e Elkan (1)
publishDate 2019
dc.date.none.fl_str_mv 2019
2022-07-21T12:03:02Z
2022-07-21T12:03:02Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv SKINNER, Rafael de Araujo. Sistema de recomendação de textos acadêmicos através de clusterização com k-Means iterativo. 2019. 62 f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) - Universidade Federal Fluminense, Instituto de Computação, Niterói, 2019
http://app.uff.br/riuff/handle/1/25785
identifier_str_mv SKINNER, Rafael de Araujo. Sistema de recomendação de textos acadêmicos através de clusterização com k-Means iterativo. 2019. 62 f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) - Universidade Federal Fluminense, Instituto de Computação, Niterói, 2019
url http://app.uff.br/riuff/handle/1/25785
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv CC-BY-SA
info:eu-repo/semantics/openAccess
rights_invalid_str_mv CC-BY-SA
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF)
instname:Universidade Federal Fluminense (UFF)
instacron:UFF
instname_str Universidade Federal Fluminense (UFF)
instacron_str UFF
institution UFF
reponame_str Repositório Institucional da Universidade Federal Fluminense (RIUFF)
collection Repositório Institucional da Universidade Federal Fluminense (RIUFF)
repository.name.fl_str_mv Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF)
repository.mail.fl_str_mv riuff@id.uff.br
_version_ 1802135380351254528