Aprendendo funções de ranking baseadas em blocos usando programação genética

Detalhes bibliográficos
Autor(a) principal: Sanchez, Pedro Antonio Gonzales
Data de Publicação: 2013
Outros Autores: http://lattes.cnpq.br/5743769621856276
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da UFAM
Texto Completo: http://tede.ufam.edu.br/handle/tede/2925
Resumo: Na atualidade, a Internet é considerada uma poderosa ferramenta de comunicação e informação. Seu impacto na sociedade está aumentando cada vez mais, o que significa que está se tornando indispensável. Neste contexto, sistemas de busca por informação tornam-se cada vez mais importantes. Neste trabalho, propomos um novo método de busca capaz de aprender funções de ranking que exploram a estrutura em bloco das páginas Web, usando programação genética. Diferentemente de trabalhos anteriores, nosso método permite combinar evidências tradicionais em recuperação de informação com evidências derivadas da estrutura das páginas. Para validar o método proposto, utilizamos três coleções reais de páginas (IG, CNN e BLOG). Os resultados experimentais mostram que nossa abordagem é capaz de superar os resultados de um baseline que usa informações de blocos sem aprendizagem de máquina, apresentando ganhos de precisão (MAP) de 9,38% na coleção IG, de 7,13% na CNN, e 25,87% na coleção de BLOG. Em relação a nosso segundo baseline, que usa programação genética a partir de evidências tradicionais de recuperação de informação, nosso método conseguiu ganhos de 5,25% na coleção IG, 10,37% na CNN e 4,37% na coleção de BLOG.
id UFAM_6a22c56e25a732bf61d62f2d2fbab6c2
oai_identifier_str oai:https://tede.ufam.edu.br/handle/:tede/2925
network_acronym_str UFAM
network_name_str Biblioteca Digital de Teses e Dissertações da UFAM
repository_id_str 6592
spelling Aprendendo funções de ranking baseadas em blocos usando programação genéticaProgramação genéticaEstrutura de bloco das páginas WebFunções de rankingGenetic programmingBlock structure of the Web pagesRanking functionsCIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃONa atualidade, a Internet é considerada uma poderosa ferramenta de comunicação e informação. Seu impacto na sociedade está aumentando cada vez mais, o que significa que está se tornando indispensável. Neste contexto, sistemas de busca por informação tornam-se cada vez mais importantes. Neste trabalho, propomos um novo método de busca capaz de aprender funções de ranking que exploram a estrutura em bloco das páginas Web, usando programação genética. Diferentemente de trabalhos anteriores, nosso método permite combinar evidências tradicionais em recuperação de informação com evidências derivadas da estrutura das páginas. Para validar o método proposto, utilizamos três coleções reais de páginas (IG, CNN e BLOG). Os resultados experimentais mostram que nossa abordagem é capaz de superar os resultados de um baseline que usa informações de blocos sem aprendizagem de máquina, apresentando ganhos de precisão (MAP) de 9,38% na coleção IG, de 7,13% na CNN, e 25,87% na coleção de BLOG. Em relação a nosso segundo baseline, que usa programação genética a partir de evidências tradicionais de recuperação de informação, nosso método conseguiu ganhos de 5,25% na coleção IG, 10,37% na CNN e 4,37% na coleção de BLOG.Today, the Internet is considered a powerful tool of communication and information. Its impact on society is increasing more and more, which means that it is becoming indispensable. In this context information searching systems are becoming increasingly important. In this paper, we propose a new search method capable of learning ranking functions that explore Web pages structure in blocks, using genetic programming. Different from previous works, our method allows combining traditional evidence in information retrieval with evidence derived from the structure of Web pages. To validate the proposed method, we use three real collections of pages (IG, CNN and BLOG). Experimental results show that our approach is able to overcome the results of a baseline of information which uses blocks information without learning machine, presenting precision benefits (MAP) of 9.38% in the IG collection, from 7.13% in CNN, and 25.87% in collection BLOG. Regarding our second baseline, which uses genetic programming out of traditional evidence in information retrieval, our method achieved benefits of 5.25% in the IG collection, 10.37% and 4.37% on CNN in collection BLOG.CNPq - Conselho Nacional de Desenvolvimento Científico e TecnológicoUniversidade Federal do AmazonasInstituto de ComputaçãoBRUFAMPrograma de Pós-graduação em InformáticaOliveira, David Braga Fernandes dehttp://lattes.cnpq.br/9561812825173697Sanchez, Pedro Antonio Gonzaleshttp://lattes.cnpq.br/57437696218562762015-04-11T14:02:59Z2014-07-152013-07-17info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfSANCHEZ, Pedro Antonio Gonzales. Aprendendo funções de ranking baseadas em blocos usando programação genética. 2013. 50 f. Dissertação (Mestrado em Informática) - Universidade Federal do Amazonas, Manaus, 2013.http://tede.ufam.edu.br/handle/tede/2925porinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFAMinstname:Universidade Federal do Amazonas (UFAM)instacron:UFAM2016-05-11T14:29:30Zoai:https://tede.ufam.edu.br/handle/:tede/2925Biblioteca Digital de Teses e Dissertaçõeshttp://200.129.163.131:8080/PUBhttp://200.129.163.131:8080/oai/requestddbc@ufam.edu.br||ddbc@ufam.edu.bropendoar:65922016-05-11T14:29:30Biblioteca Digital de Teses e Dissertações da UFAM - Universidade Federal do Amazonas (UFAM)false
dc.title.none.fl_str_mv Aprendendo funções de ranking baseadas em blocos usando programação genética
title Aprendendo funções de ranking baseadas em blocos usando programação genética
spellingShingle Aprendendo funções de ranking baseadas em blocos usando programação genética
Sanchez, Pedro Antonio Gonzales
Programação genética
Estrutura de bloco das páginas Web
Funções de ranking
Genetic programming
Block structure of the Web pages
Ranking functions
CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO
title_short Aprendendo funções de ranking baseadas em blocos usando programação genética
title_full Aprendendo funções de ranking baseadas em blocos usando programação genética
title_fullStr Aprendendo funções de ranking baseadas em blocos usando programação genética
title_full_unstemmed Aprendendo funções de ranking baseadas em blocos usando programação genética
title_sort Aprendendo funções de ranking baseadas em blocos usando programação genética
author Sanchez, Pedro Antonio Gonzales
author_facet Sanchez, Pedro Antonio Gonzales
http://lattes.cnpq.br/5743769621856276
author_role author
author2 http://lattes.cnpq.br/5743769621856276
author2_role author
dc.contributor.none.fl_str_mv Oliveira, David Braga Fernandes de
http://lattes.cnpq.br/9561812825173697
dc.contributor.author.fl_str_mv Sanchez, Pedro Antonio Gonzales
http://lattes.cnpq.br/5743769621856276
dc.subject.por.fl_str_mv Programação genética
Estrutura de bloco das páginas Web
Funções de ranking
Genetic programming
Block structure of the Web pages
Ranking functions
CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO
topic Programação genética
Estrutura de bloco das páginas Web
Funções de ranking
Genetic programming
Block structure of the Web pages
Ranking functions
CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO
description Na atualidade, a Internet é considerada uma poderosa ferramenta de comunicação e informação. Seu impacto na sociedade está aumentando cada vez mais, o que significa que está se tornando indispensável. Neste contexto, sistemas de busca por informação tornam-se cada vez mais importantes. Neste trabalho, propomos um novo método de busca capaz de aprender funções de ranking que exploram a estrutura em bloco das páginas Web, usando programação genética. Diferentemente de trabalhos anteriores, nosso método permite combinar evidências tradicionais em recuperação de informação com evidências derivadas da estrutura das páginas. Para validar o método proposto, utilizamos três coleções reais de páginas (IG, CNN e BLOG). Os resultados experimentais mostram que nossa abordagem é capaz de superar os resultados de um baseline que usa informações de blocos sem aprendizagem de máquina, apresentando ganhos de precisão (MAP) de 9,38% na coleção IG, de 7,13% na CNN, e 25,87% na coleção de BLOG. Em relação a nosso segundo baseline, que usa programação genética a partir de evidências tradicionais de recuperação de informação, nosso método conseguiu ganhos de 5,25% na coleção IG, 10,37% na CNN e 4,37% na coleção de BLOG.
publishDate 2013
dc.date.none.fl_str_mv 2013-07-17
2014-07-15
2015-04-11T14:02:59Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv SANCHEZ, Pedro Antonio Gonzales. Aprendendo funções de ranking baseadas em blocos usando programação genética. 2013. 50 f. Dissertação (Mestrado em Informática) - Universidade Federal do Amazonas, Manaus, 2013.
http://tede.ufam.edu.br/handle/tede/2925
identifier_str_mv SANCHEZ, Pedro Antonio Gonzales. Aprendendo funções de ranking baseadas em blocos usando programação genética. 2013. 50 f. Dissertação (Mestrado em Informática) - Universidade Federal do Amazonas, Manaus, 2013.
url http://tede.ufam.edu.br/handle/tede/2925
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal do Amazonas
Instituto de Computação
BR
UFAM
Programa de Pós-graduação em Informática
publisher.none.fl_str_mv Universidade Federal do Amazonas
Instituto de Computação
BR
UFAM
Programa de Pós-graduação em Informática
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFAM
instname:Universidade Federal do Amazonas (UFAM)
instacron:UFAM
instname_str Universidade Federal do Amazonas (UFAM)
instacron_str UFAM
institution UFAM
reponame_str Biblioteca Digital de Teses e Dissertações da UFAM
collection Biblioteca Digital de Teses e Dissertações da UFAM
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFAM - Universidade Federal do Amazonas (UFAM)
repository.mail.fl_str_mv ddbc@ufam.edu.br||ddbc@ufam.edu.br
_version_ 1809732004017602560