A semantic rank-based graph embedding

Detalhes bibliográficos
Autor(a) principal: Fernando, Filipe Alves de [UNESP]
Data de Publicação: 2020
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Repositório Institucional da UNESP
Texto Completo: http://hdl.handle.net/11449/194497
Resumo: Grafos são ferramentas poderosas, capazes de capturar relações complexas existentes entre objetos. Em decorrência de sua robustez e flexibilidade, diversas aplicações podem beneficiar-se de modelagens baseadas em grafos. No entanto, o processamento de grafos, principalmente em cenários de larga escala, é computacionalmente custoso e muitas vezes inviável. Métodos de Graph Embedding são usados para encontrar representações vetoriais de baixa dimensionalidade para grafos, preservando suas características principais como topologia, afinidade e vizinhança compartilhada entre nós, possibilitando que tarefas analíticas como classificação, agrupamento, recuperação de informações, predição de conexões e outras possam ser executadas. Com isso em mente, este trabalho, propõe RaDE (Rank Diffusion Embedding), um método eficiente e eficaz para aprender representações vetoriais de baixa dimensionalidade de nós de grafos. O método proposto identifica representantes altamente eficazes em grafos baseados em modelagens de ranqueamento, além de ser totalmente não supervisionado e independente do domínio de dados. Uma vantagem do RaDE sobre os métodos concorrentes é que cada dimensão das representações vetoriais geradas possui um significado semântico. Além do RaDE, este trabalho também propõe o RaDE+, que é uma variante do RaDE. O RaDE+ considera múltiplos representantes ao invés de um único por dimensão. A abordagem proposta foi avaliada em 8 conjuntos de dados tais como redes sociais, redes de co-referências, documentos textuais e conjuntos de imagem. Destacando que um dos conjuntos de dados avaliados é um conjunto de images de raio-x de pulmões de pessoas com Covid-19, pneumonia e saudáveis. O RaDE/RaDE+ foram aplicados neste conjunto de dados para ambas as tarefas: visualização e recuperação de informação e as representações vetoriais geradas por ambos os métodos alcançaram resultados de alta eficácia, superando os resultados do métodos concorrentes na maioria dos conjuntos de dados.
id UNSP_41e17b72fc4395c9b86764a96c649894
oai_identifier_str oai:repositorio.unesp.br:11449/194497
network_acronym_str UNSP
network_name_str Repositório Institucional da UNESP
repository_id_str 2946
spelling A semantic rank-based graph embeddingAprendizado de representação de grafos semântica e baseada em rankingAprendizado de representação de grafosAprendizado de máquinasGrafosInteligência artificialNetwork representation learningMachine learningGraphsArtificial intelligenceGrafos são ferramentas poderosas, capazes de capturar relações complexas existentes entre objetos. Em decorrência de sua robustez e flexibilidade, diversas aplicações podem beneficiar-se de modelagens baseadas em grafos. No entanto, o processamento de grafos, principalmente em cenários de larga escala, é computacionalmente custoso e muitas vezes inviável. Métodos de Graph Embedding são usados para encontrar representações vetoriais de baixa dimensionalidade para grafos, preservando suas características principais como topologia, afinidade e vizinhança compartilhada entre nós, possibilitando que tarefas analíticas como classificação, agrupamento, recuperação de informações, predição de conexões e outras possam ser executadas. Com isso em mente, este trabalho, propõe RaDE (Rank Diffusion Embedding), um método eficiente e eficaz para aprender representações vetoriais de baixa dimensionalidade de nós de grafos. O método proposto identifica representantes altamente eficazes em grafos baseados em modelagens de ranqueamento, além de ser totalmente não supervisionado e independente do domínio de dados. Uma vantagem do RaDE sobre os métodos concorrentes é que cada dimensão das representações vetoriais geradas possui um significado semântico. Além do RaDE, este trabalho também propõe o RaDE+, que é uma variante do RaDE. O RaDE+ considera múltiplos representantes ao invés de um único por dimensão. A abordagem proposta foi avaliada em 8 conjuntos de dados tais como redes sociais, redes de co-referências, documentos textuais e conjuntos de imagem. Destacando que um dos conjuntos de dados avaliados é um conjunto de images de raio-x de pulmões de pessoas com Covid-19, pneumonia e saudáveis. O RaDE/RaDE+ foram aplicados neste conjunto de dados para ambas as tarefas: visualização e recuperação de informação e as representações vetoriais geradas por ambos os métodos alcançaram resultados de alta eficácia, superando os resultados do métodos concorrentes na maioria dos conjuntos de dados.Graphs are powerful tools, capable of capture complex relationships existing among objects. Due to its robustness and flexibility, many application can benefit from gaph-based modeling. However, performance issues can be observed specially on large scale networks, making it computationally unfeasible to process information in various scenarios. Graph Embedding methods are usually used for finding low-dimensional vector representations for graphs, preserving its main properties such as topological characteristics, affinity and shared neighborhood between nodes, making it possible that analytical tasks such as classification, clustering, information retrieval and link prediction to be performed. To address theses problems, this work, proposes RaDE (Rank Diffusion Embedding), an efficient and effective approach to learn low-dimensional vector representations for nodes in graphs. The proposed method identifies high-effective representatives nodes in rank-based modeled graphs besides being completely unsupervised and independent of the data domain. A benefit of RaDE over the competitor methods is that each dimension of the vector representations generated by RaDE has a semantic meaning. In addition, this work also proposes RaDE+, which is a variant of RaDE, that considers multiple high-effective representative nodes for each dimension instead of single representatives as RaDE. The proposed approach was evaluated on 8 datasets such as a social networks, co-reference networks, textual documents and image datasets. Emphasizing that one of the evaluated datasets is an image dataset of lung x-ray from people with Covid-19, pneumonia or healthy. RaDE and RaDE+ were evaluated for both: visualization and retrieval tasks in this dataset and vector representations generated by both methods achieved better results than the competitor methods in most datasets.OutraFundação para o Desenvolvimento da UNESP (FUNDUNESP)FUNDUNESP: 2014/00545-0Universidade Estadual Paulista (Unesp)Pedronette, Daniel Carlos Guimarães [UNESP]Guilherme, Ivan Rizzo [UNESP]Universidade Estadual Paulista (Unesp)Fernando, Filipe Alves de [UNESP]2020-12-07T12:39:10Z2020-12-07T12:39:10Z2020-09-29info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/11449/19449733004153073P2enginfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UNESPinstname:Universidade Estadual Paulista (UNESP)instacron:UNESP2023-12-21T06:18:50Zoai:repositorio.unesp.br:11449/194497Repositório InstitucionalPUBhttp://repositorio.unesp.br/oai/requestopendoar:29462024-08-05T20:51:52.859612Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)false
dc.title.none.fl_str_mv A semantic rank-based graph embedding
Aprendizado de representação de grafos semântica e baseada em ranking
title A semantic rank-based graph embedding
spellingShingle A semantic rank-based graph embedding
Fernando, Filipe Alves de [UNESP]
Aprendizado de representação de grafos
Aprendizado de máquinas
Grafos
Inteligência artificial
Network representation learning
Machine learning
Graphs
Artificial intelligence
title_short A semantic rank-based graph embedding
title_full A semantic rank-based graph embedding
title_fullStr A semantic rank-based graph embedding
title_full_unstemmed A semantic rank-based graph embedding
title_sort A semantic rank-based graph embedding
author Fernando, Filipe Alves de [UNESP]
author_facet Fernando, Filipe Alves de [UNESP]
author_role author
dc.contributor.none.fl_str_mv Pedronette, Daniel Carlos Guimarães [UNESP]
Guilherme, Ivan Rizzo [UNESP]
Universidade Estadual Paulista (Unesp)
dc.contributor.author.fl_str_mv Fernando, Filipe Alves de [UNESP]
dc.subject.por.fl_str_mv Aprendizado de representação de grafos
Aprendizado de máquinas
Grafos
Inteligência artificial
Network representation learning
Machine learning
Graphs
Artificial intelligence
topic Aprendizado de representação de grafos
Aprendizado de máquinas
Grafos
Inteligência artificial
Network representation learning
Machine learning
Graphs
Artificial intelligence
description Grafos são ferramentas poderosas, capazes de capturar relações complexas existentes entre objetos. Em decorrência de sua robustez e flexibilidade, diversas aplicações podem beneficiar-se de modelagens baseadas em grafos. No entanto, o processamento de grafos, principalmente em cenários de larga escala, é computacionalmente custoso e muitas vezes inviável. Métodos de Graph Embedding são usados para encontrar representações vetoriais de baixa dimensionalidade para grafos, preservando suas características principais como topologia, afinidade e vizinhança compartilhada entre nós, possibilitando que tarefas analíticas como classificação, agrupamento, recuperação de informações, predição de conexões e outras possam ser executadas. Com isso em mente, este trabalho, propõe RaDE (Rank Diffusion Embedding), um método eficiente e eficaz para aprender representações vetoriais de baixa dimensionalidade de nós de grafos. O método proposto identifica representantes altamente eficazes em grafos baseados em modelagens de ranqueamento, além de ser totalmente não supervisionado e independente do domínio de dados. Uma vantagem do RaDE sobre os métodos concorrentes é que cada dimensão das representações vetoriais geradas possui um significado semântico. Além do RaDE, este trabalho também propõe o RaDE+, que é uma variante do RaDE. O RaDE+ considera múltiplos representantes ao invés de um único por dimensão. A abordagem proposta foi avaliada em 8 conjuntos de dados tais como redes sociais, redes de co-referências, documentos textuais e conjuntos de imagem. Destacando que um dos conjuntos de dados avaliados é um conjunto de images de raio-x de pulmões de pessoas com Covid-19, pneumonia e saudáveis. O RaDE/RaDE+ foram aplicados neste conjunto de dados para ambas as tarefas: visualização e recuperação de informação e as representações vetoriais geradas por ambos os métodos alcançaram resultados de alta eficácia, superando os resultados do métodos concorrentes na maioria dos conjuntos de dados.
publishDate 2020
dc.date.none.fl_str_mv 2020-12-07T12:39:10Z
2020-12-07T12:39:10Z
2020-09-29
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/11449/194497
33004153073P2
url http://hdl.handle.net/11449/194497
identifier_str_mv 33004153073P2
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Estadual Paulista (Unesp)
publisher.none.fl_str_mv Universidade Estadual Paulista (Unesp)
dc.source.none.fl_str_mv reponame:Repositório Institucional da UNESP
instname:Universidade Estadual Paulista (UNESP)
instacron:UNESP
instname_str Universidade Estadual Paulista (UNESP)
instacron_str UNESP
institution UNESP
reponame_str Repositório Institucional da UNESP
collection Repositório Institucional da UNESP
repository.name.fl_str_mv Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)
repository.mail.fl_str_mv
_version_ 1808129259870355456