Descoberta automática de sub-áreas científicas baseada em co-autoria : o caso da computação
Autor(a) principal: | |
---|---|
Data de Publicação: | 2022 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
Texto Completo: | https://hdl.handle.net/20.500.12733/5282 |
Resumo: | Orientador: Jacques Wainer |
id |
UNICAMP-30_a74658d7f9bc27d003c388c03110882f |
---|---|
oai_identifier_str |
oai::1247332 |
network_acronym_str |
UNICAMP-30 |
network_name_str |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
repository_id_str |
|
spelling |
Descoberta automática de sub-áreas científicas baseada em co-autoria : o caso da computaçãoAutomatic discovery of scientific subfields based on co-authorship : the case of computer scienceAlgoritmos em grafosVisualização da informaçãoAprendizado de máquinaGraph algorithmsInformation visualizationMachine learningOrientador: Jacques WainerDissertação (mestrado) - Universidade Estadual de Campinas, Instituto de ComputaçãoResumo: Este trabalho tem como objetivo achar subáreas da computação. Para isso foi necessária uma extração dos dados do conjunto de publicações do DBLP, e então transformá-los em um grafo de revistas, sendo o número de autores comuns entre cada revista o fator principal para o cálculo do peso da aresta. Em seguida, 3 algoritmos de clusterização foram implementados: Agrupamento Hierárquico, algoritmo de clusterização recursivo e o terceiro sendo um método fazendo o Embedding do grafo para um espaço de dimensão específica e então clusterizando para esse espaço usando um dos algoritmos clássicos. A análise dos resultados foi feita a partir de um algoritmo de rotulação das comunidades, onde as palavras mais comuns dos títulos das revistas eram levados em consideração. Com isso, foi possível clusterizar subáreas da computação sem usar os nomes das revistas mas usando-as para verificar a qualidade dos resultados como uma variável latenteAbstract: This work has the objective to find computer subareas. For this, it was necessary the data extraction from DBLP publication set, then transform them into a graph of venues, beeing the amount of authors in common between two venues the main factor to calculate the edge weight. After this, 3 clusterization algorithms were implemented: hierarchical clustering, recursive clustering and the third applying Embedding to the graph transforming it into a low dimensional space and then clustering this space using one of the classic clustering algorithms. The results were analysed from a community labeling algorithm, that discovers the most common words from the venues titles. With this, it was possible to clusterize computer subareas without using the venues names but using them to verify the quality like a latent variableMestradoCiência da ComputaçãoMestre em Ciência da ComputaçãoCAPES001[s.n.]Wainer, Jacques, 1958-Santanchè, AndréMena-Chalco, Jesús PascualUniversidade Estadual de Campinas (UNICAMP). Instituto de ComputaçãoPrograma de Pós-Graduação em Ciência da ComputaçãoUNIVERSIDADE ESTADUAL DE CAMPINASMerli, Gustavo de Jesus, 1996-20222022-06-15T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdf1 recurso online (88 p.) : il., digital, arquivo PDF.https://hdl.handle.net/20.500.12733/5282MERLI, Gustavo de Jesus. Descoberta automática de sub-áreas científicas baseada em co-autoria: o caso da computação. 2022. 1 recurso online (88 p.) Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/5282. Acesso em: 3 set. 2024.https://repositorio.unicamp.br/acervo/detalhe/1247332Requisitos do sistema: Software para leitura de arquivo em PDFporreponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)instname:Universidade Estadual de Campinas (UNICAMP)instacron:UNICAMPinfo:eu-repo/semantics/openAccess2022-08-11T16:39:20Zoai::1247332Biblioteca Digital de Teses e DissertaçõesPUBhttp://repositorio.unicamp.br/oai/tese/oai.aspsbubd@unicamp.bropendoar:2022-08-11T16:39:20Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)false |
dc.title.none.fl_str_mv |
Descoberta automática de sub-áreas científicas baseada em co-autoria : o caso da computação Automatic discovery of scientific subfields based on co-authorship : the case of computer science |
title |
Descoberta automática de sub-áreas científicas baseada em co-autoria : o caso da computação |
spellingShingle |
Descoberta automática de sub-áreas científicas baseada em co-autoria : o caso da computação Merli, Gustavo de Jesus, 1996- Algoritmos em grafos Visualização da informação Aprendizado de máquina Graph algorithms Information visualization Machine learning |
title_short |
Descoberta automática de sub-áreas científicas baseada em co-autoria : o caso da computação |
title_full |
Descoberta automática de sub-áreas científicas baseada em co-autoria : o caso da computação |
title_fullStr |
Descoberta automática de sub-áreas científicas baseada em co-autoria : o caso da computação |
title_full_unstemmed |
Descoberta automática de sub-áreas científicas baseada em co-autoria : o caso da computação |
title_sort |
Descoberta automática de sub-áreas científicas baseada em co-autoria : o caso da computação |
author |
Merli, Gustavo de Jesus, 1996- |
author_facet |
Merli, Gustavo de Jesus, 1996- |
author_role |
author |
dc.contributor.none.fl_str_mv |
Wainer, Jacques, 1958- Santanchè, André Mena-Chalco, Jesús Pascual Universidade Estadual de Campinas (UNICAMP). Instituto de Computação Programa de Pós-Graduação em Ciência da Computação UNIVERSIDADE ESTADUAL DE CAMPINAS |
dc.contributor.author.fl_str_mv |
Merli, Gustavo de Jesus, 1996- |
dc.subject.por.fl_str_mv |
Algoritmos em grafos Visualização da informação Aprendizado de máquina Graph algorithms Information visualization Machine learning |
topic |
Algoritmos em grafos Visualização da informação Aprendizado de máquina Graph algorithms Information visualization Machine learning |
description |
Orientador: Jacques Wainer |
publishDate |
2022 |
dc.date.none.fl_str_mv |
2022 2022-06-15T00:00:00Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://hdl.handle.net/20.500.12733/5282 MERLI, Gustavo de Jesus. Descoberta automática de sub-áreas científicas baseada em co-autoria: o caso da computação. 2022. 1 recurso online (88 p.) Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/5282. Acesso em: 3 set. 2024. |
url |
https://hdl.handle.net/20.500.12733/5282 |
identifier_str_mv |
MERLI, Gustavo de Jesus. Descoberta automática de sub-áreas científicas baseada em co-autoria: o caso da computação. 2022. 1 recurso online (88 p.) Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/5282. Acesso em: 3 set. 2024. |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
https://repositorio.unicamp.br/acervo/detalhe/1247332 Requisitos do sistema: Software para leitura de arquivo em PDF |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf 1 recurso online (88 p.) : il., digital, arquivo PDF. |
dc.publisher.none.fl_str_mv |
[s.n.] |
publisher.none.fl_str_mv |
[s.n.] |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) instname:Universidade Estadual de Campinas (UNICAMP) instacron:UNICAMP |
instname_str |
Universidade Estadual de Campinas (UNICAMP) |
instacron_str |
UNICAMP |
institution |
UNICAMP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
collection |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP) |
repository.mail.fl_str_mv |
sbubd@unicamp.br |
_version_ |
1809189183444484096 |