A semantic rank-based graph embedding

Fernando, Filipe Alves de [UNESP]

A semantic rank-based graph embedding

Detalhes bibliográficos
Autor(a) principal:	Fernando, Filipe Alves de [UNESP]
Data de Publicação:	2020
Tipo de documento:	Dissertação
Idioma:	eng
Título da fonte:	Repositório Institucional da UNESP
Texto Completo:	http://hdl.handle.net/11449/194497
Resumo:	Grafos são ferramentas poderosas, capazes de capturar relações complexas existentes entre objetos. Em decorrência de sua robustez e flexibilidade, diversas aplicações podem beneficiar-se de modelagens baseadas em grafos. No entanto, o processamento de grafos, principalmente em cenários de larga escala, é computacionalmente custoso e muitas vezes inviável. Métodos de Graph Embedding são usados para encontrar representações vetoriais de baixa dimensionalidade para grafos, preservando suas características principais como topologia, afinidade e vizinhança compartilhada entre nós, possibilitando que tarefas analíticas como classificação, agrupamento, recuperação de informações, predição de conexões e outras possam ser executadas. Com isso em mente, este trabalho, propõe RaDE (Rank Diffusion Embedding), um método eficiente e eficaz para aprender representações vetoriais de baixa dimensionalidade de nós de grafos. O método proposto identifica representantes altamente eficazes em grafos baseados em modelagens de ranqueamento, além de ser totalmente não supervisionado e independente do domínio de dados. Uma vantagem do RaDE sobre os métodos concorrentes é que cada dimensão das representações vetoriais geradas possui um significado semântico. Além do RaDE, este trabalho também propõe o RaDE+, que é uma variante do RaDE. O RaDE+ considera múltiplos representantes ao invés de um único por dimensão. A abordagem proposta foi avaliada em 8 conjuntos de dados tais como redes sociais, redes de co-referências, documentos textuais e conjuntos de imagem. Destacando que um dos conjuntos de dados avaliados é um conjunto de images de raio-x de pulmões de pessoas com Covid-19, pneumonia e saudáveis. O RaDE/RaDE+ foram aplicados neste conjunto de dados para ambas as tarefas: visualização e recuperação de informação e as representações vetoriais geradas por ambos os métodos alcançaram resultados de alta eficácia, superando os resultados do métodos concorrentes na maioria dos conjuntos de dados.

Metadados do item

id	UNSP_41e17b72fc4395c9b86764a96c649894
oai_identifier_str	oai:repositorio.unesp.br:11449/194497
network_acronym_str	UNSP
network_name_str	Repositório Institucional da UNESP
repository_id_str	2946
spelling	A semantic rank-based graph embeddingAprendizado de representação de grafos semântica e baseada em rankingAprendizado de representação de grafosAprendizado de máquinasGrafosInteligência artificialNetwork representation learningMachine learningGraphsArtificial intelligenceGrafos são ferramentas poderosas, capazes de capturar relações complexas existentes entre objetos. Em decorrência de sua robustez e flexibilidade, diversas aplicações podem beneficiar-se de modelagens baseadas em grafos. No entanto, o processamento de grafos, principalmente em cenários de larga escala, é computacionalmente custoso e muitas vezes inviável. Métodos de Graph Embedding são usados para encontrar representações vetoriais de baixa dimensionalidade para grafos, preservando suas características principais como topologia, afinidade e vizinhança compartilhada entre nós, possibilitando que tarefas analíticas como classificação, agrupamento, recuperação de informações, predição de conexões e outras possam ser executadas. Com isso em mente, este trabalho, propõe RaDE (Rank Diffusion Embedding), um método eficiente e eficaz para aprender representações vetoriais de baixa dimensionalidade de nós de grafos. O método proposto identifica representantes altamente eficazes em grafos baseados em modelagens de ranqueamento, além de ser totalmente não supervisionado e independente do domínio de dados. Uma vantagem do RaDE sobre os métodos concorrentes é que cada dimensão das representações vetoriais geradas possui um significado semântico. Além do RaDE, este trabalho também propõe o RaDE+, que é uma variante do RaDE. O RaDE+ considera múltiplos representantes ao invés de um único por dimensão. A abordagem proposta foi avaliada em 8 conjuntos de dados tais como redes sociais, redes de co-referências, documentos textuais e conjuntos de imagem. Destacando que um dos conjuntos de dados avaliados é um conjunto de images de raio-x de pulmões de pessoas com Covid-19, pneumonia e saudáveis. O RaDE/RaDE+ foram aplicados neste conjunto de dados para ambas as tarefas: visualização e recuperação de informação e as representações vetoriais geradas por ambos os métodos alcançaram resultados de alta eficácia, superando os resultados do métodos concorrentes na maioria dos conjuntos de dados.Graphs are powerful tools, capable of capture complex relationships existing among objects. Due to its robustness and flexibility, many application can benefit from gaph-based modeling. However, performance issues can be observed specially on large scale networks, making it computationally unfeasible to process information in various scenarios. Graph Embedding methods are usually used for finding low-dimensional vector representations for graphs, preserving its main properties such as topological characteristics, affinity and shared neighborhood between nodes, making it possible that analytical tasks such as classification, clustering, information retrieval and link prediction to be performed. To address theses problems, this work, proposes RaDE (Rank Diffusion Embedding), an efficient and effective approach to learn low-dimensional vector representations for nodes in graphs. The proposed method identifies high-effective representatives nodes in rank-based modeled graphs besides being completely unsupervised and independent of the data domain. A benefit of RaDE over the competitor methods is that each dimension of the vector representations generated by RaDE has a semantic meaning. In addition, this work also proposes RaDE+, which is a variant of RaDE, that considers multiple high-effective representative nodes for each dimension instead of single representatives as RaDE. The proposed approach was evaluated on 8 datasets such as a social networks, co-reference networks, textual documents and image datasets. Emphasizing that one of the evaluated datasets is an image dataset of lung x-ray from people with Covid-19, pneumonia or healthy. RaDE and RaDE+ were evaluated for both: visualization and retrieval tasks in this dataset and vector representations generated by both methods achieved better results than the competitor methods in most datasets.OutraFundação para o Desenvolvimento da UNESP (FUNDUNESP)FUNDUNESP: 2014/00545-0Universidade Estadual Paulista (Unesp)Pedronette, Daniel Carlos Guimarães [UNESP]Guilherme, Ivan Rizzo [UNESP]Universidade Estadual Paulista (Unesp)Fernando, Filipe Alves de [UNESP]2020-12-07T12:39:10Z2020-12-07T12:39:10Z2020-09-29info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/11449/19449733004153073P2enginfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UNESPinstname:Universidade Estadual Paulista (UNESP)instacron:UNESP2023-12-21T06:18:50Zoai:repositorio.unesp.br:11449/194497Repositório InstitucionalPUBhttp://repositorio.unesp.br/oai/requestopendoar:29462024-08-05T20:51:52.859612Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)false
dc.title.none.fl_str_mv	A semantic rank-based graph embedding Aprendizado de representação de grafos semântica e baseada em ranking
title	A semantic rank-based graph embedding
spellingShingle	A semantic rank-based graph embedding Fernando, Filipe Alves de [UNESP] Aprendizado de representação de grafos Aprendizado de máquinas Grafos Inteligência artificial Network representation learning Machine learning Graphs Artificial intelligence
title_short	A semantic rank-based graph embedding
title_full	A semantic rank-based graph embedding
title_fullStr	A semantic rank-based graph embedding
title_full_unstemmed	A semantic rank-based graph embedding
title_sort	A semantic rank-based graph embedding
author	Fernando, Filipe Alves de [UNESP]
author_facet	Fernando, Filipe Alves de [UNESP]
author_role	author
dc.contributor.none.fl_str_mv	Pedronette, Daniel Carlos Guimarães [UNESP] Guilherme, Ivan Rizzo [UNESP] Universidade Estadual Paulista (Unesp)
dc.contributor.author.fl_str_mv	Fernando, Filipe Alves de [UNESP]
dc.subject.por.fl_str_mv	Aprendizado de representação de grafos Aprendizado de máquinas Grafos Inteligência artificial Network representation learning Machine learning Graphs Artificial intelligence
topic	Aprendizado de representação de grafos Aprendizado de máquinas Grafos Inteligência artificial Network representation learning Machine learning Graphs Artificial intelligence
description	Grafos são ferramentas poderosas, capazes de capturar relações complexas existentes entre objetos. Em decorrência de sua robustez e flexibilidade, diversas aplicações podem beneficiar-se de modelagens baseadas em grafos. No entanto, o processamento de grafos, principalmente em cenários de larga escala, é computacionalmente custoso e muitas vezes inviável. Métodos de Graph Embedding são usados para encontrar representações vetoriais de baixa dimensionalidade para grafos, preservando suas características principais como topologia, afinidade e vizinhança compartilhada entre nós, possibilitando que tarefas analíticas como classificação, agrupamento, recuperação de informações, predição de conexões e outras possam ser executadas. Com isso em mente, este trabalho, propõe RaDE (Rank Diffusion Embedding), um método eficiente e eficaz para aprender representações vetoriais de baixa dimensionalidade de nós de grafos. O método proposto identifica representantes altamente eficazes em grafos baseados em modelagens de ranqueamento, além de ser totalmente não supervisionado e independente do domínio de dados. Uma vantagem do RaDE sobre os métodos concorrentes é que cada dimensão das representações vetoriais geradas possui um significado semântico. Além do RaDE, este trabalho também propõe o RaDE+, que é uma variante do RaDE. O RaDE+ considera múltiplos representantes ao invés de um único por dimensão. A abordagem proposta foi avaliada em 8 conjuntos de dados tais como redes sociais, redes de co-referências, documentos textuais e conjuntos de imagem. Destacando que um dos conjuntos de dados avaliados é um conjunto de images de raio-x de pulmões de pessoas com Covid-19, pneumonia e saudáveis. O RaDE/RaDE+ foram aplicados neste conjunto de dados para ambas as tarefas: visualização e recuperação de informação e as representações vetoriais geradas por ambos os métodos alcançaram resultados de alta eficácia, superando os resultados do métodos concorrentes na maioria dos conjuntos de dados.
publishDate	2020
dc.date.none.fl_str_mv	2020-12-07T12:39:10Z 2020-12-07T12:39:10Z 2020-09-29
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	http://hdl.handle.net/11449/194497 33004153073P2
url	http://hdl.handle.net/11449/194497
identifier_str_mv	33004153073P2
dc.language.iso.fl_str_mv	eng
language	eng
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.publisher.none.fl_str_mv	Universidade Estadual Paulista (Unesp)
publisher.none.fl_str_mv	Universidade Estadual Paulista (Unesp)
dc.source.none.fl_str_mv	reponame:Repositório Institucional da UNESP instname:Universidade Estadual Paulista (UNESP) instacron:UNESP
instname_str	Universidade Estadual Paulista (UNESP)
instacron_str	UNESP
institution	UNESP
reponame_str	Repositório Institucional da UNESP
collection	Repositório Institucional da UNESP
repository.name.fl_str_mv	Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)
repository.mail.fl_str_mv
_version_	1808129259870355456

A semantic rank-based graph embedding

Registros relacionados