Algoritmos para avaliação de confiança em apontadores encontrados na Web

Detalhes bibliográficos
Autor(a) principal: Souza, Jucimar Brito de
Data de Publicação: 2009
Outros Autores: http://lattes.cnpq.br/0217852318751550
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da UFAM
Texto Completo: http://tede.ufam.edu.br/handle/tede/2960
Resumo: Máquinas de busca têm se tornado uma ferramenta imprescindível para os usuários da Web. Elas utilizam algoritmos de análise de apontadores para explorar a estrutura dos apontadores da Web para atribuir uma estimativa de popularidade a cada página. Essa informação é usada na ordenação da lista de respostas dada por máquinas de busca a consultas submetidas por seus usuários. Contudo, alguns tipos de apontadores prejudicam a qualidade da estimativa de popularidade por apresentar informação ruidosa, podendo assim afetar negativamente a qualidade de respostas providas por máquinas de busca a seus usuários. Exemplos de tais apontadores incluem apontadores repetidos, apontadores resultantes da duplicação de páginas, SPAM, dentre outros. Esse trabalho tem como objetivo detectar ruídos na estrutura dos apontadores existentes em base de dados de máquinas de busca. Foi estudado o impacto dos métodos aqui desenvolvidos para detecção de apontadores ruidosos, considerando cenários nos quais a reputação das páginas é calculada tanto com o algoritmos Pagerank quanto com o algoritmo Indegree. Os resultados dos experimentos apresentaram melhoria de até 68,33% na métrica Mean Reciprocal Rank (MRR) para consultas navegacionais e de até 35,36% para as consultas navegacionais aleatórias quando uma máquina de busca utiliza o algoritmo Pagerank.
id UFAM_1a113426eb2d40f4f50d857d4765f1bc
oai_identifier_str oai:https://tede.ufam.edu.br/handle/:tede/2960
network_acronym_str UFAM
network_name_str Biblioteca Digital de Teses e Dissertações da UFAM
repository_id_str 6592
spelling Algoritmos para avaliação de confiança em apontadores encontrados na WebAlgorithms for Assessing Reliability Pointers Found on the WebRecuperação da informaçãoMáquina de buscaAnálise de apontadoresRuídoInformation retrievalSearch engineLink analysisNoiseCIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃOMáquinas de busca têm se tornado uma ferramenta imprescindível para os usuários da Web. Elas utilizam algoritmos de análise de apontadores para explorar a estrutura dos apontadores da Web para atribuir uma estimativa de popularidade a cada página. Essa informação é usada na ordenação da lista de respostas dada por máquinas de busca a consultas submetidas por seus usuários. Contudo, alguns tipos de apontadores prejudicam a qualidade da estimativa de popularidade por apresentar informação ruidosa, podendo assim afetar negativamente a qualidade de respostas providas por máquinas de busca a seus usuários. Exemplos de tais apontadores incluem apontadores repetidos, apontadores resultantes da duplicação de páginas, SPAM, dentre outros. Esse trabalho tem como objetivo detectar ruídos na estrutura dos apontadores existentes em base de dados de máquinas de busca. Foi estudado o impacto dos métodos aqui desenvolvidos para detecção de apontadores ruidosos, considerando cenários nos quais a reputação das páginas é calculada tanto com o algoritmos Pagerank quanto com o algoritmo Indegree. Os resultados dos experimentos apresentaram melhoria de até 68,33% na métrica Mean Reciprocal Rank (MRR) para consultas navegacionais e de até 35,36% para as consultas navegacionais aleatórias quando uma máquina de busca utiliza o algoritmo Pagerank.Search engines have become an essential tool for web users today. They use algorithms to analyze the linkage relationships of the pages in order to estimate popularity for each page, taking each link as a vote of quality for pages. This information is used in the search engine ranking algorithms. However, a large amount of links found on the Web can not be considered as a good vote for quality, presenting information that can be considered as noise for search engine ranking algorithms. This work aims to detect noises in the structure of links that exist in search engine collections. We studied the impact of the methods developed here for detection of noisy links, considering scenarios in which the reputation of pages is calculated using Pagerank and Indegree algorithms. The results of the experiments showed improvement up to 68.33% in metric Mean Reciprocal Rank (MRR) for navigational queries and up to 35.36% for randomly selected navigational queries.Coordenação de Aperfeiçoamento de Pessoal de Nível SuperiorUniversidade Federal do AmazonasInstituto de ComputaçãoBRUFAMPrograma de Pós-graduação em InformáticaMoura, Edleno Silva dehttp://lattes.cnpq.br/4737852130924504Souza, Jucimar Brito dehttp://lattes.cnpq.br/02178523187515502015-04-11T14:03:17Z2012-10-082009-04-23info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfSOUZA, Jucimar Brito de.Algoritmos para avaliação de confiança em apontadores encontrados na Web. 2009. 98 f. Dissertação (Mestrado em Informática) - Universidade Federal do Amazonas, Manaus, 2009.http://tede.ufam.edu.br/handle/tede/2960porinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFAMinstname:Universidade Federal do Amazonas (UFAM)instacron:UFAM2016-04-22T14:33:26Zoai:https://tede.ufam.edu.br/handle/:tede/2960Biblioteca Digital de Teses e Dissertaçõeshttp://200.129.163.131:8080/PUBhttp://200.129.163.131:8080/oai/requestddbc@ufam.edu.br||ddbc@ufam.edu.bropendoar:65922016-04-22T14:33:26Biblioteca Digital de Teses e Dissertações da UFAM - Universidade Federal do Amazonas (UFAM)false
dc.title.none.fl_str_mv Algoritmos para avaliação de confiança em apontadores encontrados na Web
Algorithms for Assessing Reliability Pointers Found on the Web
title Algoritmos para avaliação de confiança em apontadores encontrados na Web
spellingShingle Algoritmos para avaliação de confiança em apontadores encontrados na Web
Souza, Jucimar Brito de
Recuperação da informação
Máquina de busca
Análise de apontadores
Ruído
Information retrieval
Search engine
Link analysis
Noise
CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO
title_short Algoritmos para avaliação de confiança em apontadores encontrados na Web
title_full Algoritmos para avaliação de confiança em apontadores encontrados na Web
title_fullStr Algoritmos para avaliação de confiança em apontadores encontrados na Web
title_full_unstemmed Algoritmos para avaliação de confiança em apontadores encontrados na Web
title_sort Algoritmos para avaliação de confiança em apontadores encontrados na Web
author Souza, Jucimar Brito de
author_facet Souza, Jucimar Brito de
http://lattes.cnpq.br/0217852318751550
author_role author
author2 http://lattes.cnpq.br/0217852318751550
author2_role author
dc.contributor.none.fl_str_mv Moura, Edleno Silva de
http://lattes.cnpq.br/4737852130924504
dc.contributor.author.fl_str_mv Souza, Jucimar Brito de
http://lattes.cnpq.br/0217852318751550
dc.subject.por.fl_str_mv Recuperação da informação
Máquina de busca
Análise de apontadores
Ruído
Information retrieval
Search engine
Link analysis
Noise
CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO
topic Recuperação da informação
Máquina de busca
Análise de apontadores
Ruído
Information retrieval
Search engine
Link analysis
Noise
CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO
description Máquinas de busca têm se tornado uma ferramenta imprescindível para os usuários da Web. Elas utilizam algoritmos de análise de apontadores para explorar a estrutura dos apontadores da Web para atribuir uma estimativa de popularidade a cada página. Essa informação é usada na ordenação da lista de respostas dada por máquinas de busca a consultas submetidas por seus usuários. Contudo, alguns tipos de apontadores prejudicam a qualidade da estimativa de popularidade por apresentar informação ruidosa, podendo assim afetar negativamente a qualidade de respostas providas por máquinas de busca a seus usuários. Exemplos de tais apontadores incluem apontadores repetidos, apontadores resultantes da duplicação de páginas, SPAM, dentre outros. Esse trabalho tem como objetivo detectar ruídos na estrutura dos apontadores existentes em base de dados de máquinas de busca. Foi estudado o impacto dos métodos aqui desenvolvidos para detecção de apontadores ruidosos, considerando cenários nos quais a reputação das páginas é calculada tanto com o algoritmos Pagerank quanto com o algoritmo Indegree. Os resultados dos experimentos apresentaram melhoria de até 68,33% na métrica Mean Reciprocal Rank (MRR) para consultas navegacionais e de até 35,36% para as consultas navegacionais aleatórias quando uma máquina de busca utiliza o algoritmo Pagerank.
publishDate 2009
dc.date.none.fl_str_mv 2009-04-23
2012-10-08
2015-04-11T14:03:17Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv SOUZA, Jucimar Brito de.Algoritmos para avaliação de confiança em apontadores encontrados na Web. 2009. 98 f. Dissertação (Mestrado em Informática) - Universidade Federal do Amazonas, Manaus, 2009.
http://tede.ufam.edu.br/handle/tede/2960
identifier_str_mv SOUZA, Jucimar Brito de.Algoritmos para avaliação de confiança em apontadores encontrados na Web. 2009. 98 f. Dissertação (Mestrado em Informática) - Universidade Federal do Amazonas, Manaus, 2009.
url http://tede.ufam.edu.br/handle/tede/2960
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal do Amazonas
Instituto de Computação
BR
UFAM
Programa de Pós-graduação em Informática
publisher.none.fl_str_mv Universidade Federal do Amazonas
Instituto de Computação
BR
UFAM
Programa de Pós-graduação em Informática
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFAM
instname:Universidade Federal do Amazonas (UFAM)
instacron:UFAM
instname_str Universidade Federal do Amazonas (UFAM)
instacron_str UFAM
institution UFAM
reponame_str Biblioteca Digital de Teses e Dissertações da UFAM
collection Biblioteca Digital de Teses e Dissertações da UFAM
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFAM - Universidade Federal do Amazonas (UFAM)
repository.mail.fl_str_mv ddbc@ufam.edu.br||ddbc@ufam.edu.br
_version_ 1809732004683448320