[pt] XHITS: ESTENDENDO O ALGORITMO HITS PARA EXTRAÇÃO DE TÓPICOS NA WWW

Detalhes bibliográficos
Autor(a) principal: FRANCISCO BENJAMIM FILHO
Data de Publicação: 2005
Tipo de documento: Outros
Idioma: por
Título da fonte: Repositório Institucional da PUC-RIO (Projeto Maxwell)
Texto Completo: https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=7081@1
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=7081@2
http://doi.org/10.17771/PUCRio.acad.7081
Resumo: [pt] O ambiente baseado em hyperlink possui na sua topologia informações substanciais sobre o seu conteúdo. Baseado nesse tipo de ambiente, Jon Kleingerg desenvolveu um conjunto de algoritmos, popularmente conhecido como HITS (Hyperlink Induced Topic Search), que utiliza a estrutura de hyperlinks na WWW para extrair essas informações. O foco central desses algoritmos é a classificação de tópicos de busca de caráter geral na WWW, através da descoberta de páginas que representam autoridade sobre tais tópicos. Para tanto, os algoritmos formulam a noção de autoridade considerando o relacionamento, decorrente da estrutura de hyperlink, entre o conjunto de páginas que são autoridades relevantes e o conjunto de páginas que apontam para essas, denominadas de hubs. Jon Kleingerg definiu, portanto, uma relação de interdependência entre os conjuntos anteriormente citados: uma boa autoridade será uma página apontada por bons hubs e um bom hub será uma página que aponta para boas autoridades. Neste trabalho, propomos a extensão do modelo formulado por Jon Kleingerg, através da inserção de novos conceitos nas relações de interdependência entre autoridades e hubs. Assim, formulamos um algoritmo estendido, XHITS (Extended Hyperlink Induced Topic Search), que visa melhorar a classificação das autoridades do ambiente. Nessa extensão as autoridades são apontadas por bons hubs, às vezes apontadas por bons portais e também apontam para boas novidades. Os bons hubs são páginas que apontam para boas autoridades e novidades, e são apontados por bons portais. As boas novidades são páginas que são apontadas pelas boas autoridades, pelos bons hubs e pelos bons portais e bons portais são páginas que apontam para as boas autoridades, para bons hubs e para boas novidades. Adicionalmente, mostramos que o algoritmo proposto converge e também os diversos resultados experimentais que indicam a melhoria na precisão dos hiperdocumentos recuperados.
id PUC_RIO-1_15196a7dd4e74b46f3b1b0331bd33b2b
oai_identifier_str oai:MAXWELL.puc-rio.br:7081
network_acronym_str PUC_RIO-1
network_name_str Repositório Institucional da PUC-RIO (Projeto Maxwell)
repository_id_str 534
spelling [pt] XHITS: ESTENDENDO O ALGORITMO HITS PARA EXTRAÇÃO DE TÓPICOS NA WWW[en] XHITS: EXTENDING THE HITS ALGORITHM FOR DISTILLATION OF BROAD SEARCH TOPIC ON WWW[pt] AUTORIDADE[pt] XHITS[pt] HITS[pt] HUBS[pt] ANALISE DE HYPERLINKS[en] AUTHORITY[en] XHITS[en] HITS[en] HUBS[en] LINK ANALYSIS[pt] O ambiente baseado em hyperlink possui na sua topologia informações substanciais sobre o seu conteúdo. Baseado nesse tipo de ambiente, Jon Kleingerg desenvolveu um conjunto de algoritmos, popularmente conhecido como HITS (Hyperlink Induced Topic Search), que utiliza a estrutura de hyperlinks na WWW para extrair essas informações. O foco central desses algoritmos é a classificação de tópicos de busca de caráter geral na WWW, através da descoberta de páginas que representam autoridade sobre tais tópicos. Para tanto, os algoritmos formulam a noção de autoridade considerando o relacionamento, decorrente da estrutura de hyperlink, entre o conjunto de páginas que são autoridades relevantes e o conjunto de páginas que apontam para essas, denominadas de hubs. Jon Kleingerg definiu, portanto, uma relação de interdependência entre os conjuntos anteriormente citados: uma boa autoridade será uma página apontada por bons hubs e um bom hub será uma página que aponta para boas autoridades. Neste trabalho, propomos a extensão do modelo formulado por Jon Kleingerg, através da inserção de novos conceitos nas relações de interdependência entre autoridades e hubs. Assim, formulamos um algoritmo estendido, XHITS (Extended Hyperlink Induced Topic Search), que visa melhorar a classificação das autoridades do ambiente. Nessa extensão as autoridades são apontadas por bons hubs, às vezes apontadas por bons portais e também apontam para boas novidades. Os bons hubs são páginas que apontam para boas autoridades e novidades, e são apontados por bons portais. As boas novidades são páginas que são apontadas pelas boas autoridades, pelos bons hubs e pelos bons portais e bons portais são páginas que apontam para as boas autoridades, para bons hubs e para boas novidades. Adicionalmente, mostramos que o algoritmo proposto converge e também os diversos resultados experimentais que indicam a melhoria na precisão dos hiperdocumentos recuperados.[en] The network structure of a hyperlinked environment can be a rich source of information about the content of this environment. Jon Kleinberg developed a set of algorithms, called HITS (Hyperlink Induced Topic Search), for extracting information from the hyperlink structures of those environments. The aim of these algorithms is the distillation of broad search topics, through the discovery of related authoritative information sources. The notion of authority is based on the hyperlink structure relationship between a set of relevant authoritative pages and the set of hubs. Thus, hubs and authorities exhibit what could be called a mutually reinforcing relationship: a good hub is a page that points to many good authorities; a good authority is a page that is pointed by many good hubs. In this work, we present the XHITS (Extended Hyperlink Induced Topic Search) algorithm, an extension of the HITS algorithm by introducing new concepts on the mutually reinforcing relationship. In XHITS, a good authority is a page that is pointed by many good hubs, some good portals and points to good novels; a good hub is a page that points to many good authorities, some good novels and is pointed by some good portals; and a good novel is a page that is pointed by good authorities, some good hubs and some good portals; a good portal is a page that points to some good authorities, some good hubs and some good novels. In addition, we show that XHITS converges and, through some experiments, the improved quality of the hyper documents retrieved.MAXWELLRUY LUIZ MILIDIUFRANCISCO BENJAMIM FILHO2005-09-20info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/otherhttps://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=7081@1https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=7081@2http://doi.org/10.17771/PUCRio.acad.7081porreponame:Repositório Institucional da PUC-RIO (Projeto Maxwell)instname:Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)instacron:PUC_RIOinfo:eu-repo/semantics/openAccess2019-06-10T00:00:00Zoai:MAXWELL.puc-rio.br:7081Repositório InstitucionalPRIhttps://www.maxwell.vrac.puc-rio.br/ibict.phpopendoar:5342019-06-10T00:00Repositório Institucional da PUC-RIO (Projeto Maxwell) - Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)false
dc.title.none.fl_str_mv [pt] XHITS: ESTENDENDO O ALGORITMO HITS PARA EXTRAÇÃO DE TÓPICOS NA WWW
[en] XHITS: EXTENDING THE HITS ALGORITHM FOR DISTILLATION OF BROAD SEARCH TOPIC ON WWW
title [pt] XHITS: ESTENDENDO O ALGORITMO HITS PARA EXTRAÇÃO DE TÓPICOS NA WWW
spellingShingle [pt] XHITS: ESTENDENDO O ALGORITMO HITS PARA EXTRAÇÃO DE TÓPICOS NA WWW
FRANCISCO BENJAMIM FILHO
[pt] AUTORIDADE
[pt] XHITS
[pt] HITS
[pt] HUBS
[pt] ANALISE DE HYPERLINKS
[en] AUTHORITY
[en] XHITS
[en] HITS
[en] HUBS
[en] LINK ANALYSIS
title_short [pt] XHITS: ESTENDENDO O ALGORITMO HITS PARA EXTRAÇÃO DE TÓPICOS NA WWW
title_full [pt] XHITS: ESTENDENDO O ALGORITMO HITS PARA EXTRAÇÃO DE TÓPICOS NA WWW
title_fullStr [pt] XHITS: ESTENDENDO O ALGORITMO HITS PARA EXTRAÇÃO DE TÓPICOS NA WWW
title_full_unstemmed [pt] XHITS: ESTENDENDO O ALGORITMO HITS PARA EXTRAÇÃO DE TÓPICOS NA WWW
title_sort [pt] XHITS: ESTENDENDO O ALGORITMO HITS PARA EXTRAÇÃO DE TÓPICOS NA WWW
author FRANCISCO BENJAMIM FILHO
author_facet FRANCISCO BENJAMIM FILHO
author_role author
dc.contributor.none.fl_str_mv RUY LUIZ MILIDIU
dc.contributor.author.fl_str_mv FRANCISCO BENJAMIM FILHO
dc.subject.por.fl_str_mv [pt] AUTORIDADE
[pt] XHITS
[pt] HITS
[pt] HUBS
[pt] ANALISE DE HYPERLINKS
[en] AUTHORITY
[en] XHITS
[en] HITS
[en] HUBS
[en] LINK ANALYSIS
topic [pt] AUTORIDADE
[pt] XHITS
[pt] HITS
[pt] HUBS
[pt] ANALISE DE HYPERLINKS
[en] AUTHORITY
[en] XHITS
[en] HITS
[en] HUBS
[en] LINK ANALYSIS
description [pt] O ambiente baseado em hyperlink possui na sua topologia informações substanciais sobre o seu conteúdo. Baseado nesse tipo de ambiente, Jon Kleingerg desenvolveu um conjunto de algoritmos, popularmente conhecido como HITS (Hyperlink Induced Topic Search), que utiliza a estrutura de hyperlinks na WWW para extrair essas informações. O foco central desses algoritmos é a classificação de tópicos de busca de caráter geral na WWW, através da descoberta de páginas que representam autoridade sobre tais tópicos. Para tanto, os algoritmos formulam a noção de autoridade considerando o relacionamento, decorrente da estrutura de hyperlink, entre o conjunto de páginas que são autoridades relevantes e o conjunto de páginas que apontam para essas, denominadas de hubs. Jon Kleingerg definiu, portanto, uma relação de interdependência entre os conjuntos anteriormente citados: uma boa autoridade será uma página apontada por bons hubs e um bom hub será uma página que aponta para boas autoridades. Neste trabalho, propomos a extensão do modelo formulado por Jon Kleingerg, através da inserção de novos conceitos nas relações de interdependência entre autoridades e hubs. Assim, formulamos um algoritmo estendido, XHITS (Extended Hyperlink Induced Topic Search), que visa melhorar a classificação das autoridades do ambiente. Nessa extensão as autoridades são apontadas por bons hubs, às vezes apontadas por bons portais e também apontam para boas novidades. Os bons hubs são páginas que apontam para boas autoridades e novidades, e são apontados por bons portais. As boas novidades são páginas que são apontadas pelas boas autoridades, pelos bons hubs e pelos bons portais e bons portais são páginas que apontam para as boas autoridades, para bons hubs e para boas novidades. Adicionalmente, mostramos que o algoritmo proposto converge e também os diversos resultados experimentais que indicam a melhoria na precisão dos hiperdocumentos recuperados.
publishDate 2005
dc.date.none.fl_str_mv 2005-09-20
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/other
format other
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=7081@1
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=7081@2
http://doi.org/10.17771/PUCRio.acad.7081
url https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=7081@1
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=7081@2
http://doi.org/10.17771/PUCRio.acad.7081
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv MAXWELL
publisher.none.fl_str_mv MAXWELL
dc.source.none.fl_str_mv reponame:Repositório Institucional da PUC-RIO (Projeto Maxwell)
instname:Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)
instacron:PUC_RIO
instname_str Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)
instacron_str PUC_RIO
institution PUC_RIO
reponame_str Repositório Institucional da PUC-RIO (Projeto Maxwell)
collection Repositório Institucional da PUC-RIO (Projeto Maxwell)
repository.name.fl_str_mv Repositório Institucional da PUC-RIO (Projeto Maxwell) - Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)
repository.mail.fl_str_mv
_version_ 1814822554449215488