Classificação transdutiva em redes heterogêneas de informação, baseada na divergência KL
Autor(a) principal: | |
---|---|
Data de Publicação: | 2020 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da USP |
Texto Completo: | https://www.teses.usp.br/teses/disponiveis/55/55134/tde-08062020-095905/ |
Resumo: | A área de esquisa em Redes Heterogêneas de Informação (HIN) é um recente e proeminente tópico, especialmente quando consideramos que grande parte dos dados de mundo real possuem características heterogêneas. Tais dados, com topologias complexas como relações entre diferentes tipos de objetos, o que não é naturalmente representável pelas tradicionais redes homogêneas. Além disso, comparada com as pesquisas existentes em redes homogêneas ou mesmo em redes bipartidas, a área de pesquisa em HIN ainda permanece com diversos pontos inexplorados. Dentre estes, o desenvolvimento de métodos para a classificação transdutiva em HIN apresenta diversas possibilidades de desenvolvimento. Nesta tese foi proposto o método TCHN de classificação transdutiva de HIN. Tal método tem como diferencial a utilização da divergência KL como medida de similaridade para a regularização da propagação de informação pelos vetores de informação. Esta modelagem tem como motivação o fato de tal métrica ser mais apropriada para a regularização de distribuições de probabilidade, considerando que a distribuição de informação na rede tende a se comporta de tal maneira. Experimentos comprovam que o método TCHN produz resultados comparáveis ou até mesmo superiores aos métodos representativos da área, confirmando assim sua efetividade para a classificação em diversos cenários. Além disso, a complexidade do método TCHN para redes esparsas mostra-se bastante atrativa para a aplicação em dados de mundo real, que como já comentado possuem naturalmente características heterogêneas. Além do desenvolvimento do método TCHN, como parte das demandas da área que impactaram neste trabalho, foi desenvolvida uma ferramenta de geração de redes heterogêneas sintéticas, camada HNOC, em parceria com outros pesquisadores do grupo de pesquisa. Esta já se mostrou bastante útil para a validação do método TCHN, pois com seu uso, foi possível a comparação das técnicas em redes com diferentes características com um custo bastante reduzido se comparado com o possível custo de levantamento de redes semelhantes com base em dados reais. |
id |
USP_c8af7cec3ae6fa3d670d8043a32ee9b5 |
---|---|
oai_identifier_str |
oai:teses.usp.br:tde-08062020-095905 |
network_acronym_str |
USP |
network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
repository_id_str |
2721 |
spelling |
Classificação transdutiva em redes heterogêneas de informação, baseada na divergência KLTransductive classification in heterogeneous information networks based on KL-divergenceClassificação transdutivaDivergência KLHeterogeneous information networksKL-divergenceRedes heterogêneas de informaçãoTransductive classificationA área de esquisa em Redes Heterogêneas de Informação (HIN) é um recente e proeminente tópico, especialmente quando consideramos que grande parte dos dados de mundo real possuem características heterogêneas. Tais dados, com topologias complexas como relações entre diferentes tipos de objetos, o que não é naturalmente representável pelas tradicionais redes homogêneas. Além disso, comparada com as pesquisas existentes em redes homogêneas ou mesmo em redes bipartidas, a área de pesquisa em HIN ainda permanece com diversos pontos inexplorados. Dentre estes, o desenvolvimento de métodos para a classificação transdutiva em HIN apresenta diversas possibilidades de desenvolvimento. Nesta tese foi proposto o método TCHN de classificação transdutiva de HIN. Tal método tem como diferencial a utilização da divergência KL como medida de similaridade para a regularização da propagação de informação pelos vetores de informação. Esta modelagem tem como motivação o fato de tal métrica ser mais apropriada para a regularização de distribuições de probabilidade, considerando que a distribuição de informação na rede tende a se comporta de tal maneira. Experimentos comprovam que o método TCHN produz resultados comparáveis ou até mesmo superiores aos métodos representativos da área, confirmando assim sua efetividade para a classificação em diversos cenários. Além disso, a complexidade do método TCHN para redes esparsas mostra-se bastante atrativa para a aplicação em dados de mundo real, que como já comentado possuem naturalmente características heterogêneas. Além do desenvolvimento do método TCHN, como parte das demandas da área que impactaram neste trabalho, foi desenvolvida uma ferramenta de geração de redes heterogêneas sintéticas, camada HNOC, em parceria com outros pesquisadores do grupo de pesquisa. Esta já se mostrou bastante útil para a validação do método TCHN, pois com seu uso, foi possível a comparação das técnicas em redes com diferentes características com um custo bastante reduzido se comparado com o possível custo de levantamento de redes semelhantes com base em dados reais.Heterogeneous Information Networks (HIN) is a promising and recent research topic, specially considering that much real world data are heterogeneous. Those data, with complex topology such as relation among different types of objects, are not naturally represented by usual homogeneous networks. Moreover, compared to existing research on homogeneous networks, or even on bipartite networks, HIN research field still presents many unexplored points. Among these, the development of methods for transductive classification in HIN presents several development possibilities. In this thesis we propose a new transductive classification method on HIN called TCHN. This method has as a differential the use of KL divergence as a similarity measure to regularize the information propagation through information vectors. This modeling is motivated by the fact that such metric is more appropriate for the regularization of probability distributions, considering that the information distribution in the network tends to behave in such a way. Experiments show the TCHN method produces results comparable or even superior to representative methods of the area, thus confirming its effectiveness for classification in different scenarios. Moreover, the complexity of the TCHN method for sparse networks is attractive for application to real world data, which as already discussed naturally have heterogeneous characteristics. In addition to the development of the TCHN method, as part of the demands of the area that impacted this work, it was developed a tool for synthetic heterogeneous network generation, this development was made in partnership with other researchers of our group. HNOC has already proved to be very useful in the validation of the TCHN method, with its use it was possible to compare the techniques in networks with different characteristics at a very low cost compared to the possible cost of surveying similar networks based on real data.Biblioteca Digitais de Teses e Dissertações da USPLopes, Alneu de AndradeRomanetto, Luzia de Menezes2020-02-11info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/55/55134/tde-08062020-095905/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2020-06-08T16:04:02Zoai:teses.usp.br:tde-08062020-095905Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212020-06-08T16:04:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
dc.title.none.fl_str_mv |
Classificação transdutiva em redes heterogêneas de informação, baseada na divergência KL Transductive classification in heterogeneous information networks based on KL-divergence |
title |
Classificação transdutiva em redes heterogêneas de informação, baseada na divergência KL |
spellingShingle |
Classificação transdutiva em redes heterogêneas de informação, baseada na divergência KL Romanetto, Luzia de Menezes Classificação transdutiva Divergência KL Heterogeneous information networks KL-divergence Redes heterogêneas de informação Transductive classification |
title_short |
Classificação transdutiva em redes heterogêneas de informação, baseada na divergência KL |
title_full |
Classificação transdutiva em redes heterogêneas de informação, baseada na divergência KL |
title_fullStr |
Classificação transdutiva em redes heterogêneas de informação, baseada na divergência KL |
title_full_unstemmed |
Classificação transdutiva em redes heterogêneas de informação, baseada na divergência KL |
title_sort |
Classificação transdutiva em redes heterogêneas de informação, baseada na divergência KL |
author |
Romanetto, Luzia de Menezes |
author_facet |
Romanetto, Luzia de Menezes |
author_role |
author |
dc.contributor.none.fl_str_mv |
Lopes, Alneu de Andrade |
dc.contributor.author.fl_str_mv |
Romanetto, Luzia de Menezes |
dc.subject.por.fl_str_mv |
Classificação transdutiva Divergência KL Heterogeneous information networks KL-divergence Redes heterogêneas de informação Transductive classification |
topic |
Classificação transdutiva Divergência KL Heterogeneous information networks KL-divergence Redes heterogêneas de informação Transductive classification |
description |
A área de esquisa em Redes Heterogêneas de Informação (HIN) é um recente e proeminente tópico, especialmente quando consideramos que grande parte dos dados de mundo real possuem características heterogêneas. Tais dados, com topologias complexas como relações entre diferentes tipos de objetos, o que não é naturalmente representável pelas tradicionais redes homogêneas. Além disso, comparada com as pesquisas existentes em redes homogêneas ou mesmo em redes bipartidas, a área de pesquisa em HIN ainda permanece com diversos pontos inexplorados. Dentre estes, o desenvolvimento de métodos para a classificação transdutiva em HIN apresenta diversas possibilidades de desenvolvimento. Nesta tese foi proposto o método TCHN de classificação transdutiva de HIN. Tal método tem como diferencial a utilização da divergência KL como medida de similaridade para a regularização da propagação de informação pelos vetores de informação. Esta modelagem tem como motivação o fato de tal métrica ser mais apropriada para a regularização de distribuições de probabilidade, considerando que a distribuição de informação na rede tende a se comporta de tal maneira. Experimentos comprovam que o método TCHN produz resultados comparáveis ou até mesmo superiores aos métodos representativos da área, confirmando assim sua efetividade para a classificação em diversos cenários. Além disso, a complexidade do método TCHN para redes esparsas mostra-se bastante atrativa para a aplicação em dados de mundo real, que como já comentado possuem naturalmente características heterogêneas. Além do desenvolvimento do método TCHN, como parte das demandas da área que impactaram neste trabalho, foi desenvolvida uma ferramenta de geração de redes heterogêneas sintéticas, camada HNOC, em parceria com outros pesquisadores do grupo de pesquisa. Esta já se mostrou bastante útil para a validação do método TCHN, pois com seu uso, foi possível a comparação das técnicas em redes com diferentes características com um custo bastante reduzido se comparado com o possível custo de levantamento de redes semelhantes com base em dados reais. |
publishDate |
2020 |
dc.date.none.fl_str_mv |
2020-02-11 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/55/55134/tde-08062020-095905/ |
url |
https://www.teses.usp.br/teses/disponiveis/55/55134/tde-08062020-095905/ |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
|
dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.coverage.none.fl_str_mv |
|
dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
instname_str |
Universidade de São Paulo (USP) |
instacron_str |
USP |
institution |
USP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
collection |
Biblioteca Digital de Teses e Dissertações da USP |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
_version_ |
1809090512707125248 |