Sistema de recomendação de textos acadêmicos através de clusterização com k-Means iterativo
Autor(a) principal: | |
---|---|
Data de Publicação: | 2019 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da Universidade Federal Fluminense (RIUFF) |
Texto Completo: | http://app.uff.br/riuff/handle/1/25785 |
Resumo: | Este trabalho emprega uma técnica de aprendizado não supervisionada para a criação de clusters de artigos semelhantes da base de dados da Sociedade Brasileira de Computação (SBC), que utiliza o popular algoritmo k-Means. Mais, especificamente, é feito um processo iterativo na execução do k-Means, onde o número de clusters k é determinado de maneira incremental, começando com k assumindo o valor um e incrementando-o a cada iteração sem sucesso. Posteriormente, recomeçando o processo quando for encontrado algum cluster com tamanho dentro do limite especificado. Dessa forma, a escolha de k é substituída pela escolha do tamanho máximo dos clusters finais, obtendo-se clusters com tamanhos controlados, idealmente pouco discrepantes e, ainda, eliminando a difícil escolha do k. Tendo em vista que nem sempre é claro qual o melhor valor a ser definido e, usualmente, a escolha é feita baseada em conhecimento prévio do conjunto, de suposições ou de experiência prática, segundo Hamerly e Elkan (1) |
id |
UFF-2_d6088b802ebda462be1d7e8bbd9c8344 |
---|---|
oai_identifier_str |
oai:app.uff.br:1/25785 |
network_acronym_str |
UFF-2 |
network_name_str |
Repositório Institucional da Universidade Federal Fluminense (RIUFF) |
repository_id_str |
2120 |
spelling |
Sistema de recomendação de textos acadêmicos através de clusterização com k-Means iterativoClustersClusterizaçãoTextos acadêmicosSistema de recomendaçãoAnálise de agrupamentoSistema de recomendaçãoAlgoritmo computacionalClusterizationk-MeansAcademic textsRecommender systemsEste trabalho emprega uma técnica de aprendizado não supervisionada para a criação de clusters de artigos semelhantes da base de dados da Sociedade Brasileira de Computação (SBC), que utiliza o popular algoritmo k-Means. Mais, especificamente, é feito um processo iterativo na execução do k-Means, onde o número de clusters k é determinado de maneira incremental, começando com k assumindo o valor um e incrementando-o a cada iteração sem sucesso. Posteriormente, recomeçando o processo quando for encontrado algum cluster com tamanho dentro do limite especificado. Dessa forma, a escolha de k é substituída pela escolha do tamanho máximo dos clusters finais, obtendo-se clusters com tamanhos controlados, idealmente pouco discrepantes e, ainda, eliminando a difícil escolha do k. Tendo em vista que nem sempre é claro qual o melhor valor a ser definido e, usualmente, a escolha é feita baseada em conhecimento prévio do conjunto, de suposições ou de experiência prática, segundo Hamerly e Elkan (1)This work employs an unsupervised learning technique for clustering similar articles from the Brazilian Computer Society database, using the popular k-Means algorithm. More specifically, an iterative process is performed in the execution of k-Means, where the number of clusters k is incrementally determined, starting with k assuming the value of one and incrementing it with each unsuccessful iteration and then, restarting the process when any cluster with a size up to the specified limit is found. Thus, the choice of k is replaced by the choice of the maximum size of the final clusters, resulting in clusters with controlled sizes, ideally little discrepant, and eliminating the difficult choice of k. Given that it is not always clear what is the best value to define and, usually, the choice is made based on prior knowledge of the set, assumptions or practical experience according to Hamerly and Elkan.62 p.Filho, José ViterboMiranda, Leandro Botelho Alves deBernardini, Flávia CristinaSampaio, Igor Garcia BalhausenSkinner, Rafael de Araujo2022-07-21T12:03:02Z2022-07-21T12:03:02Z2019info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfSKINNER, Rafael de Araujo. Sistema de recomendação de textos acadêmicos através de clusterização com k-Means iterativo. 2019. 62 f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) - Universidade Federal Fluminense, Instituto de Computação, Niterói, 2019http://app.uff.br/riuff/handle/1/25785CC-BY-SAinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF)instname:Universidade Federal Fluminense (UFF)instacron:UFF2022-07-21T12:03:35Zoai:app.uff.br:1/25785Repositório InstitucionalPUBhttps://app.uff.br/oai/requestriuff@id.uff.bropendoar:21202024-08-19T11:05:02.961928Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF)false |
dc.title.none.fl_str_mv |
Sistema de recomendação de textos acadêmicos através de clusterização com k-Means iterativo |
title |
Sistema de recomendação de textos acadêmicos através de clusterização com k-Means iterativo |
spellingShingle |
Sistema de recomendação de textos acadêmicos através de clusterização com k-Means iterativo Skinner, Rafael de Araujo Clusters Clusterização Textos acadêmicos Sistema de recomendação Análise de agrupamento Sistema de recomendação Algoritmo computacional Clusterization k-Means Academic texts Recommender systems |
title_short |
Sistema de recomendação de textos acadêmicos através de clusterização com k-Means iterativo |
title_full |
Sistema de recomendação de textos acadêmicos através de clusterização com k-Means iterativo |
title_fullStr |
Sistema de recomendação de textos acadêmicos através de clusterização com k-Means iterativo |
title_full_unstemmed |
Sistema de recomendação de textos acadêmicos através de clusterização com k-Means iterativo |
title_sort |
Sistema de recomendação de textos acadêmicos através de clusterização com k-Means iterativo |
author |
Skinner, Rafael de Araujo |
author_facet |
Skinner, Rafael de Araujo |
author_role |
author |
dc.contributor.none.fl_str_mv |
Filho, José Viterbo Miranda, Leandro Botelho Alves de Bernardini, Flávia Cristina Sampaio, Igor Garcia Balhausen |
dc.contributor.author.fl_str_mv |
Skinner, Rafael de Araujo |
dc.subject.por.fl_str_mv |
Clusters Clusterização Textos acadêmicos Sistema de recomendação Análise de agrupamento Sistema de recomendação Algoritmo computacional Clusterization k-Means Academic texts Recommender systems |
topic |
Clusters Clusterização Textos acadêmicos Sistema de recomendação Análise de agrupamento Sistema de recomendação Algoritmo computacional Clusterization k-Means Academic texts Recommender systems |
description |
Este trabalho emprega uma técnica de aprendizado não supervisionada para a criação de clusters de artigos semelhantes da base de dados da Sociedade Brasileira de Computação (SBC), que utiliza o popular algoritmo k-Means. Mais, especificamente, é feito um processo iterativo na execução do k-Means, onde o número de clusters k é determinado de maneira incremental, começando com k assumindo o valor um e incrementando-o a cada iteração sem sucesso. Posteriormente, recomeçando o processo quando for encontrado algum cluster com tamanho dentro do limite especificado. Dessa forma, a escolha de k é substituída pela escolha do tamanho máximo dos clusters finais, obtendo-se clusters com tamanhos controlados, idealmente pouco discrepantes e, ainda, eliminando a difícil escolha do k. Tendo em vista que nem sempre é claro qual o melhor valor a ser definido e, usualmente, a escolha é feita baseada em conhecimento prévio do conjunto, de suposições ou de experiência prática, segundo Hamerly e Elkan (1) |
publishDate |
2019 |
dc.date.none.fl_str_mv |
2019 2022-07-21T12:03:02Z 2022-07-21T12:03:02Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
SKINNER, Rafael de Araujo. Sistema de recomendação de textos acadêmicos através de clusterização com k-Means iterativo. 2019. 62 f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) - Universidade Federal Fluminense, Instituto de Computação, Niterói, 2019 http://app.uff.br/riuff/handle/1/25785 |
identifier_str_mv |
SKINNER, Rafael de Araujo. Sistema de recomendação de textos acadêmicos através de clusterização com k-Means iterativo. 2019. 62 f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) - Universidade Federal Fluminense, Instituto de Computação, Niterói, 2019 |
url |
http://app.uff.br/riuff/handle/1/25785 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
CC-BY-SA info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
CC-BY-SA |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF) instname:Universidade Federal Fluminense (UFF) instacron:UFF |
instname_str |
Universidade Federal Fluminense (UFF) |
instacron_str |
UFF |
institution |
UFF |
reponame_str |
Repositório Institucional da Universidade Federal Fluminense (RIUFF) |
collection |
Repositório Institucional da Universidade Federal Fluminense (RIUFF) |
repository.name.fl_str_mv |
Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF) |
repository.mail.fl_str_mv |
riuff@id.uff.br |
_version_ |
1811823655510867968 |