Efeitos do coarsening na classificação de grafos k-partidos

Detalhes bibliográficos
Autor(a) principal: Althof, Paulo Eduardo
Data de Publicação: 2022
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UnB
Texto Completo: https://repositorio.unb.br/handle/10482/44803
Resumo: Dissertação (Mestrado em Informática) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, Brasília, 2022
id UNB_358d14ee3c4636fd2ad274b647eaf403
oai_identifier_str oai:repositorio.unb.br:10482/44803
network_acronym_str UNB
network_name_str Repositório Institucional da UnB
repository_id_str
spelling Efeitos do coarsening na classificação de grafos k-partidosClassificação de vérticesContração de redesGrafos heterogêneosGrafosDissertação (Mestrado em Informática) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, Brasília, 2022Com a quantidade de dados gerados no mundo ultrapassando a capacidade humana de avaliação, métodos de classificação automática de conteúdo se tornam cada vez mais relevantes. Grafos são uma forma de representação genérica de representação de entidades e suas interações, e podem ser aplicados praticamente em todo tipo de problema, principalmente em sua versão heterogênea. Por esse motivo é um dos temas que mais tem crescido no número de pesquisas na área de machine learning. Porém, essa mencionada quantidade de dados, resulta em grafos com elevado número de vértices e arestas, também gerando problemas nas questões de armazenamento e escalabilidade dos algoritmos aplicados a eles. Neste trabalho, é proposta a utilização de técnicas de coarsening, para reduzir o tamanho desses grafos como forma de endereçar estes problemas. Essa abordagem é bem estabelecida nas áreas de visualização e de particionamento de grafos, e já foi provada recentemente válida para problemas de classificação em grafos homogêneos. As questões investigadas neste trabalho dizem respeito aos níveis de economia de armazenamento e tempo de classificação proporcionados pelo coarsening, em comparação com os impactos causados pela redução dos grafos, em métricas de qualidade de classificação (Accuracy, Precision, Recall e F-score). O procedimento proposto foi avaliado em centenas de milhares de grafos, variando o número de vértices de entrada no intervalo de 15 a 100 mil vértices, com diferentes esquemas. Foram investigados os impactos também da quantidade de arestas intra-comunitárias e da esparsidade dos grafos nas citadas métricas. Quanto à economia de recursos, as reduções nos grafos apresentaram resultados expressivos, onde reduções de 20% no número de vértices chegam em economias de armazenamento de mais de 1/3, além de tornar as classificações cerca de duas vezes mais rápidas. Em contraste a isso, quanto à perda na qualidade das classificações, destaca-se como fato positivo a baixa perda apresentada para reduções em torno de 20%, com variações médias de 1.72±0.54%, 0.55 ± 0.17%, 1.78 ± 0.55%, 2.36 ± 0.77%, em relação ao grafo original, para as métricas de Accuracy, Precision, Recall e F-score, respectivamente. Com especial destaque para a perda da métrica de Precision, que, além de níveis médios baixos, apresentou uma relativa estabilidade com a variação dos tamanhos dos grafos, variando menos de 4% na comparação entre grafos de 2 mil e de 100 mil vértices. Esses resultados mostram que o coarsening tem grande potencial para gerar versões reduzidas dos grafos, reduzindo a quantidade de memória necessária para seu armazenamento e o tempo necessário para se classificá-los, sem, no entanto, resultar em perdas expressivas de qualidade.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES).With the amount of data generated in the world surpassing human capacity of evaluation, automatic content classification methods have become increasingly relevant. Graphs are a generic representation form to represent entities and their interactions and can be applied to practically every kind of problem, mostly in its heterogeneous version. For this reason, it is one of the topics that has grown the most in the machine learning area. However, this mentioned amount of data results in graphs with a high number of vertices and edges, leading to problems in terms of storage and scalability for algorithms applied to them. In this work, the use of coarsening techniques is proposed to reduce the size of these graphs as a way to address these problems. This approach is well established in the areas of graph visualization and partitioning, and has been recently proven valid for classification problems in homogeneous graphs. The research questions investigated in this work concern the levels of storage savings and classification time provided by coarsening, in comparison with the impacts caused by graph reduction, on classification quality metrics (Accuracy, Precision, Recall and F-score). The proposed procedure was evaluated in hundreds of thousands of graphs, varying the number of vertices on the input graphs in the ranges from 15 to 100 thousand vertices, with different schemes. The impacts of the amount of intra-community edges and the sparseness of the graphs on the aforementioned metrics were also investigated. In the issue of resource savings, the reductions in the graphs showed expressive results, where reductions of 20% in the number of vertices imply in storage savings of more than 1/3, in addition to making the classifications about twice as fast. In contrast to this, regarding the loss in the quality of the ratings, stands out as a positive fact the low loss presented for reductions around 20%, with average variations of 1.72 ± 0.54%, 0.55 ± 0.17%, 1.78 ± 0.55%, 2.36 ± 0.77%, relative to the original graph, for the metrics of Accuracy, Precision, Recall and F-score, respectively. With special emphasis on the loss of Precision metric, which, in addition to low average levels, presented relative stability with graph sizes variation, varying less than 4% in the comparison between graphs of 2 thousand and 100 thousand vertices. These results show that coarsening has great potential to generate reduced versions of graphs, reducing memory required for their storage and the time needed to classify them, without resulting in significant quality losses.Instituto de Ciências Exatas (IE)Departamento de Ciência da Computação (IE CIC)Programa de Pós-Graduação em InformáticaFaleiros, Thiago de Paulopealthoff@gmail.comAlthof, Paulo Eduardo2022-09-13T21:41:17Z2022-09-13T21:41:17Z2022-09-132022-05-26info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfALTHOF, Paulo Eduardo. Efeitos do coarsening na classificação de grafos k-partidos. 2022. xvii, 80 f., il. Dissertação (Mestrado em Informática) — Universidade de Brasília, Brasília, 2022.https://repositorio.unb.br/handle/10482/44803A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.bce.unb.br, www.ibict.br, http://hercules.vtls.com/cgi-bin/ndltd/chameleon?lng=pt&skin=ndltd sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data.info:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UnBinstname:Universidade de Brasília (UnB)instacron:UNB2024-03-14T15:41:33Zoai:repositorio.unb.br:10482/44803Repositório InstitucionalPUBhttps://repositorio.unb.br/oai/requestrepositorio@unb.bropendoar:2024-03-14T15:41:33Repositório Institucional da UnB - Universidade de Brasília (UnB)false
dc.title.none.fl_str_mv Efeitos do coarsening na classificação de grafos k-partidos
title Efeitos do coarsening na classificação de grafos k-partidos
spellingShingle Efeitos do coarsening na classificação de grafos k-partidos
Althof, Paulo Eduardo
Classificação de vértices
Contração de redes
Grafos heterogêneos
Grafos
title_short Efeitos do coarsening na classificação de grafos k-partidos
title_full Efeitos do coarsening na classificação de grafos k-partidos
title_fullStr Efeitos do coarsening na classificação de grafos k-partidos
title_full_unstemmed Efeitos do coarsening na classificação de grafos k-partidos
title_sort Efeitos do coarsening na classificação de grafos k-partidos
author Althof, Paulo Eduardo
author_facet Althof, Paulo Eduardo
author_role author
dc.contributor.none.fl_str_mv Faleiros, Thiago de Paulo
pealthoff@gmail.com
dc.contributor.author.fl_str_mv Althof, Paulo Eduardo
dc.subject.por.fl_str_mv Classificação de vértices
Contração de redes
Grafos heterogêneos
Grafos
topic Classificação de vértices
Contração de redes
Grafos heterogêneos
Grafos
description Dissertação (Mestrado em Informática) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, Brasília, 2022
publishDate 2022
dc.date.none.fl_str_mv 2022-09-13T21:41:17Z
2022-09-13T21:41:17Z
2022-09-13
2022-05-26
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv ALTHOF, Paulo Eduardo. Efeitos do coarsening na classificação de grafos k-partidos. 2022. xvii, 80 f., il. Dissertação (Mestrado em Informática) — Universidade de Brasília, Brasília, 2022.
https://repositorio.unb.br/handle/10482/44803
identifier_str_mv ALTHOF, Paulo Eduardo. Efeitos do coarsening na classificação de grafos k-partidos. 2022. xvii, 80 f., il. Dissertação (Mestrado em Informática) — Universidade de Brasília, Brasília, 2022.
url https://repositorio.unb.br/handle/10482/44803
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UnB
instname:Universidade de Brasília (UnB)
instacron:UNB
instname_str Universidade de Brasília (UnB)
instacron_str UNB
institution UNB
reponame_str Repositório Institucional da UnB
collection Repositório Institucional da UnB
repository.name.fl_str_mv Repositório Institucional da UnB - Universidade de Brasília (UnB)
repository.mail.fl_str_mv repositorio@unb.br
_version_ 1810580700233990144