Algoritmos para avaliação de confiança em apontadores encontrados na Web
Autor(a) principal: | |
---|---|
Data de Publicação: | 2009 |
Outros Autores: | |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da UFAM |
Texto Completo: | http://tede.ufam.edu.br/handle/tede/2960 |
Resumo: | Máquinas de busca têm se tornado uma ferramenta imprescindível para os usuários da Web. Elas utilizam algoritmos de análise de apontadores para explorar a estrutura dos apontadores da Web para atribuir uma estimativa de popularidade a cada página. Essa informação é usada na ordenação da lista de respostas dada por máquinas de busca a consultas submetidas por seus usuários. Contudo, alguns tipos de apontadores prejudicam a qualidade da estimativa de popularidade por apresentar informação ruidosa, podendo assim afetar negativamente a qualidade de respostas providas por máquinas de busca a seus usuários. Exemplos de tais apontadores incluem apontadores repetidos, apontadores resultantes da duplicação de páginas, SPAM, dentre outros. Esse trabalho tem como objetivo detectar ruídos na estrutura dos apontadores existentes em base de dados de máquinas de busca. Foi estudado o impacto dos métodos aqui desenvolvidos para detecção de apontadores ruidosos, considerando cenários nos quais a reputação das páginas é calculada tanto com o algoritmos Pagerank quanto com o algoritmo Indegree. Os resultados dos experimentos apresentaram melhoria de até 68,33% na métrica Mean Reciprocal Rank (MRR) para consultas navegacionais e de até 35,36% para as consultas navegacionais aleatórias quando uma máquina de busca utiliza o algoritmo Pagerank. |
id |
UFAM_1a113426eb2d40f4f50d857d4765f1bc |
---|---|
oai_identifier_str |
oai:https://tede.ufam.edu.br/handle/:tede/2960 |
network_acronym_str |
UFAM |
network_name_str |
Biblioteca Digital de Teses e Dissertações da UFAM |
repository_id_str |
6592 |
spelling |
Algoritmos para avaliação de confiança em apontadores encontrados na WebAlgorithms for Assessing Reliability Pointers Found on the WebRecuperação da informaçãoMáquina de buscaAnálise de apontadoresRuídoInformation retrievalSearch engineLink analysisNoiseCIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃOMáquinas de busca têm se tornado uma ferramenta imprescindível para os usuários da Web. Elas utilizam algoritmos de análise de apontadores para explorar a estrutura dos apontadores da Web para atribuir uma estimativa de popularidade a cada página. Essa informação é usada na ordenação da lista de respostas dada por máquinas de busca a consultas submetidas por seus usuários. Contudo, alguns tipos de apontadores prejudicam a qualidade da estimativa de popularidade por apresentar informação ruidosa, podendo assim afetar negativamente a qualidade de respostas providas por máquinas de busca a seus usuários. Exemplos de tais apontadores incluem apontadores repetidos, apontadores resultantes da duplicação de páginas, SPAM, dentre outros. Esse trabalho tem como objetivo detectar ruídos na estrutura dos apontadores existentes em base de dados de máquinas de busca. Foi estudado o impacto dos métodos aqui desenvolvidos para detecção de apontadores ruidosos, considerando cenários nos quais a reputação das páginas é calculada tanto com o algoritmos Pagerank quanto com o algoritmo Indegree. Os resultados dos experimentos apresentaram melhoria de até 68,33% na métrica Mean Reciprocal Rank (MRR) para consultas navegacionais e de até 35,36% para as consultas navegacionais aleatórias quando uma máquina de busca utiliza o algoritmo Pagerank.Search engines have become an essential tool for web users today. They use algorithms to analyze the linkage relationships of the pages in order to estimate popularity for each page, taking each link as a vote of quality for pages. This information is used in the search engine ranking algorithms. However, a large amount of links found on the Web can not be considered as a good vote for quality, presenting information that can be considered as noise for search engine ranking algorithms. This work aims to detect noises in the structure of links that exist in search engine collections. We studied the impact of the methods developed here for detection of noisy links, considering scenarios in which the reputation of pages is calculated using Pagerank and Indegree algorithms. The results of the experiments showed improvement up to 68.33% in metric Mean Reciprocal Rank (MRR) for navigational queries and up to 35.36% for randomly selected navigational queries.Coordenação de Aperfeiçoamento de Pessoal de Nível SuperiorUniversidade Federal do AmazonasInstituto de ComputaçãoBRUFAMPrograma de Pós-graduação em InformáticaMoura, Edleno Silva dehttp://lattes.cnpq.br/4737852130924504Souza, Jucimar Brito dehttp://lattes.cnpq.br/02178523187515502015-04-11T14:03:17Z2012-10-082009-04-23info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfSOUZA, Jucimar Brito de.Algoritmos para avaliação de confiança em apontadores encontrados na Web. 2009. 98 f. Dissertação (Mestrado em Informática) - Universidade Federal do Amazonas, Manaus, 2009.http://tede.ufam.edu.br/handle/tede/2960porinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFAMinstname:Universidade Federal do Amazonas (UFAM)instacron:UFAM2016-04-22T14:33:26Zoai:https://tede.ufam.edu.br/handle/:tede/2960Biblioteca Digital de Teses e Dissertaçõeshttp://200.129.163.131:8080/PUBhttp://200.129.163.131:8080/oai/requestddbc@ufam.edu.br||ddbc@ufam.edu.bropendoar:65922016-04-22T14:33:26Biblioteca Digital de Teses e Dissertações da UFAM - Universidade Federal do Amazonas (UFAM)false |
dc.title.none.fl_str_mv |
Algoritmos para avaliação de confiança em apontadores encontrados na Web Algorithms for Assessing Reliability Pointers Found on the Web |
title |
Algoritmos para avaliação de confiança em apontadores encontrados na Web |
spellingShingle |
Algoritmos para avaliação de confiança em apontadores encontrados na Web Souza, Jucimar Brito de Recuperação da informação Máquina de busca Análise de apontadores Ruído Information retrieval Search engine Link analysis Noise CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO |
title_short |
Algoritmos para avaliação de confiança em apontadores encontrados na Web |
title_full |
Algoritmos para avaliação de confiança em apontadores encontrados na Web |
title_fullStr |
Algoritmos para avaliação de confiança em apontadores encontrados na Web |
title_full_unstemmed |
Algoritmos para avaliação de confiança em apontadores encontrados na Web |
title_sort |
Algoritmos para avaliação de confiança em apontadores encontrados na Web |
author |
Souza, Jucimar Brito de |
author_facet |
Souza, Jucimar Brito de http://lattes.cnpq.br/0217852318751550 |
author_role |
author |
author2 |
http://lattes.cnpq.br/0217852318751550 |
author2_role |
author |
dc.contributor.none.fl_str_mv |
Moura, Edleno Silva de http://lattes.cnpq.br/4737852130924504 |
dc.contributor.author.fl_str_mv |
Souza, Jucimar Brito de http://lattes.cnpq.br/0217852318751550 |
dc.subject.por.fl_str_mv |
Recuperação da informação Máquina de busca Análise de apontadores Ruído Information retrieval Search engine Link analysis Noise CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO |
topic |
Recuperação da informação Máquina de busca Análise de apontadores Ruído Information retrieval Search engine Link analysis Noise CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO |
description |
Máquinas de busca têm se tornado uma ferramenta imprescindível para os usuários da Web. Elas utilizam algoritmos de análise de apontadores para explorar a estrutura dos apontadores da Web para atribuir uma estimativa de popularidade a cada página. Essa informação é usada na ordenação da lista de respostas dada por máquinas de busca a consultas submetidas por seus usuários. Contudo, alguns tipos de apontadores prejudicam a qualidade da estimativa de popularidade por apresentar informação ruidosa, podendo assim afetar negativamente a qualidade de respostas providas por máquinas de busca a seus usuários. Exemplos de tais apontadores incluem apontadores repetidos, apontadores resultantes da duplicação de páginas, SPAM, dentre outros. Esse trabalho tem como objetivo detectar ruídos na estrutura dos apontadores existentes em base de dados de máquinas de busca. Foi estudado o impacto dos métodos aqui desenvolvidos para detecção de apontadores ruidosos, considerando cenários nos quais a reputação das páginas é calculada tanto com o algoritmos Pagerank quanto com o algoritmo Indegree. Os resultados dos experimentos apresentaram melhoria de até 68,33% na métrica Mean Reciprocal Rank (MRR) para consultas navegacionais e de até 35,36% para as consultas navegacionais aleatórias quando uma máquina de busca utiliza o algoritmo Pagerank. |
publishDate |
2009 |
dc.date.none.fl_str_mv |
2009-04-23 2012-10-08 2015-04-11T14:03:17Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
SOUZA, Jucimar Brito de.Algoritmos para avaliação de confiança em apontadores encontrados na Web. 2009. 98 f. Dissertação (Mestrado em Informática) - Universidade Federal do Amazonas, Manaus, 2009. http://tede.ufam.edu.br/handle/tede/2960 |
identifier_str_mv |
SOUZA, Jucimar Brito de.Algoritmos para avaliação de confiança em apontadores encontrados na Web. 2009. 98 f. Dissertação (Mestrado em Informática) - Universidade Federal do Amazonas, Manaus, 2009. |
url |
http://tede.ufam.edu.br/handle/tede/2960 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade Federal do Amazonas Instituto de Computação BR UFAM Programa de Pós-graduação em Informática |
publisher.none.fl_str_mv |
Universidade Federal do Amazonas Instituto de Computação BR UFAM Programa de Pós-graduação em Informática |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UFAM instname:Universidade Federal do Amazonas (UFAM) instacron:UFAM |
instname_str |
Universidade Federal do Amazonas (UFAM) |
instacron_str |
UFAM |
institution |
UFAM |
reponame_str |
Biblioteca Digital de Teses e Dissertações da UFAM |
collection |
Biblioteca Digital de Teses e Dissertações da UFAM |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UFAM - Universidade Federal do Amazonas (UFAM) |
repository.mail.fl_str_mv |
ddbc@ufam.edu.br||ddbc@ufam.edu.br |
_version_ |
1809732004683448320 |