Aprendendo funções de ranking baseadas em blocos usando programação genética
Autor(a) principal: | |
---|---|
Data de Publicação: | 2013 |
Outros Autores: | |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da UFAM |
Texto Completo: | http://tede.ufam.edu.br/handle/tede/2925 |
Resumo: | Na atualidade, a Internet é considerada uma poderosa ferramenta de comunicação e informação. Seu impacto na sociedade está aumentando cada vez mais, o que significa que está se tornando indispensável. Neste contexto, sistemas de busca por informação tornam-se cada vez mais importantes. Neste trabalho, propomos um novo método de busca capaz de aprender funções de ranking que exploram a estrutura em bloco das páginas Web, usando programação genética. Diferentemente de trabalhos anteriores, nosso método permite combinar evidências tradicionais em recuperação de informação com evidências derivadas da estrutura das páginas. Para validar o método proposto, utilizamos três coleções reais de páginas (IG, CNN e BLOG). Os resultados experimentais mostram que nossa abordagem é capaz de superar os resultados de um baseline que usa informações de blocos sem aprendizagem de máquina, apresentando ganhos de precisão (MAP) de 9,38% na coleção IG, de 7,13% na CNN, e 25,87% na coleção de BLOG. Em relação a nosso segundo baseline, que usa programação genética a partir de evidências tradicionais de recuperação de informação, nosso método conseguiu ganhos de 5,25% na coleção IG, 10,37% na CNN e 4,37% na coleção de BLOG. |
id |
UFAM_6a22c56e25a732bf61d62f2d2fbab6c2 |
---|---|
oai_identifier_str |
oai:https://tede.ufam.edu.br/handle/:tede/2925 |
network_acronym_str |
UFAM |
network_name_str |
Biblioteca Digital de Teses e Dissertações da UFAM |
repository_id_str |
6592 |
spelling |
Aprendendo funções de ranking baseadas em blocos usando programação genéticaProgramação genéticaEstrutura de bloco das páginas WebFunções de rankingGenetic programmingBlock structure of the Web pagesRanking functionsCIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃONa atualidade, a Internet é considerada uma poderosa ferramenta de comunicação e informação. Seu impacto na sociedade está aumentando cada vez mais, o que significa que está se tornando indispensável. Neste contexto, sistemas de busca por informação tornam-se cada vez mais importantes. Neste trabalho, propomos um novo método de busca capaz de aprender funções de ranking que exploram a estrutura em bloco das páginas Web, usando programação genética. Diferentemente de trabalhos anteriores, nosso método permite combinar evidências tradicionais em recuperação de informação com evidências derivadas da estrutura das páginas. Para validar o método proposto, utilizamos três coleções reais de páginas (IG, CNN e BLOG). Os resultados experimentais mostram que nossa abordagem é capaz de superar os resultados de um baseline que usa informações de blocos sem aprendizagem de máquina, apresentando ganhos de precisão (MAP) de 9,38% na coleção IG, de 7,13% na CNN, e 25,87% na coleção de BLOG. Em relação a nosso segundo baseline, que usa programação genética a partir de evidências tradicionais de recuperação de informação, nosso método conseguiu ganhos de 5,25% na coleção IG, 10,37% na CNN e 4,37% na coleção de BLOG.Today, the Internet is considered a powerful tool of communication and information. Its impact on society is increasing more and more, which means that it is becoming indispensable. In this context information searching systems are becoming increasingly important. In this paper, we propose a new search method capable of learning ranking functions that explore Web pages structure in blocks, using genetic programming. Different from previous works, our method allows combining traditional evidence in information retrieval with evidence derived from the structure of Web pages. To validate the proposed method, we use three real collections of pages (IG, CNN and BLOG). Experimental results show that our approach is able to overcome the results of a baseline of information which uses blocks information without learning machine, presenting precision benefits (MAP) of 9.38% in the IG collection, from 7.13% in CNN, and 25.87% in collection BLOG. Regarding our second baseline, which uses genetic programming out of traditional evidence in information retrieval, our method achieved benefits of 5.25% in the IG collection, 10.37% and 4.37% on CNN in collection BLOG.CNPq - Conselho Nacional de Desenvolvimento Científico e TecnológicoUniversidade Federal do AmazonasInstituto de ComputaçãoBRUFAMPrograma de Pós-graduação em InformáticaOliveira, David Braga Fernandes dehttp://lattes.cnpq.br/9561812825173697Sanchez, Pedro Antonio Gonzaleshttp://lattes.cnpq.br/57437696218562762015-04-11T14:02:59Z2014-07-152013-07-17info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfSANCHEZ, Pedro Antonio Gonzales. Aprendendo funções de ranking baseadas em blocos usando programação genética. 2013. 50 f. Dissertação (Mestrado em Informática) - Universidade Federal do Amazonas, Manaus, 2013.http://tede.ufam.edu.br/handle/tede/2925porinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFAMinstname:Universidade Federal do Amazonas (UFAM)instacron:UFAM2016-05-11T14:29:30Zoai:https://tede.ufam.edu.br/handle/:tede/2925Biblioteca Digital de Teses e Dissertaçõeshttp://200.129.163.131:8080/PUBhttp://200.129.163.131:8080/oai/requestddbc@ufam.edu.br||ddbc@ufam.edu.bropendoar:65922016-05-11T14:29:30Biblioteca Digital de Teses e Dissertações da UFAM - Universidade Federal do Amazonas (UFAM)false |
dc.title.none.fl_str_mv |
Aprendendo funções de ranking baseadas em blocos usando programação genética |
title |
Aprendendo funções de ranking baseadas em blocos usando programação genética |
spellingShingle |
Aprendendo funções de ranking baseadas em blocos usando programação genética Sanchez, Pedro Antonio Gonzales Programação genética Estrutura de bloco das páginas Web Funções de ranking Genetic programming Block structure of the Web pages Ranking functions CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO |
title_short |
Aprendendo funções de ranking baseadas em blocos usando programação genética |
title_full |
Aprendendo funções de ranking baseadas em blocos usando programação genética |
title_fullStr |
Aprendendo funções de ranking baseadas em blocos usando programação genética |
title_full_unstemmed |
Aprendendo funções de ranking baseadas em blocos usando programação genética |
title_sort |
Aprendendo funções de ranking baseadas em blocos usando programação genética |
author |
Sanchez, Pedro Antonio Gonzales |
author_facet |
Sanchez, Pedro Antonio Gonzales http://lattes.cnpq.br/5743769621856276 |
author_role |
author |
author2 |
http://lattes.cnpq.br/5743769621856276 |
author2_role |
author |
dc.contributor.none.fl_str_mv |
Oliveira, David Braga Fernandes de http://lattes.cnpq.br/9561812825173697 |
dc.contributor.author.fl_str_mv |
Sanchez, Pedro Antonio Gonzales http://lattes.cnpq.br/5743769621856276 |
dc.subject.por.fl_str_mv |
Programação genética Estrutura de bloco das páginas Web Funções de ranking Genetic programming Block structure of the Web pages Ranking functions CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO |
topic |
Programação genética Estrutura de bloco das páginas Web Funções de ranking Genetic programming Block structure of the Web pages Ranking functions CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO |
description |
Na atualidade, a Internet é considerada uma poderosa ferramenta de comunicação e informação. Seu impacto na sociedade está aumentando cada vez mais, o que significa que está se tornando indispensável. Neste contexto, sistemas de busca por informação tornam-se cada vez mais importantes. Neste trabalho, propomos um novo método de busca capaz de aprender funções de ranking que exploram a estrutura em bloco das páginas Web, usando programação genética. Diferentemente de trabalhos anteriores, nosso método permite combinar evidências tradicionais em recuperação de informação com evidências derivadas da estrutura das páginas. Para validar o método proposto, utilizamos três coleções reais de páginas (IG, CNN e BLOG). Os resultados experimentais mostram que nossa abordagem é capaz de superar os resultados de um baseline que usa informações de blocos sem aprendizagem de máquina, apresentando ganhos de precisão (MAP) de 9,38% na coleção IG, de 7,13% na CNN, e 25,87% na coleção de BLOG. Em relação a nosso segundo baseline, que usa programação genética a partir de evidências tradicionais de recuperação de informação, nosso método conseguiu ganhos de 5,25% na coleção IG, 10,37% na CNN e 4,37% na coleção de BLOG. |
publishDate |
2013 |
dc.date.none.fl_str_mv |
2013-07-17 2014-07-15 2015-04-11T14:02:59Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
SANCHEZ, Pedro Antonio Gonzales. Aprendendo funções de ranking baseadas em blocos usando programação genética. 2013. 50 f. Dissertação (Mestrado em Informática) - Universidade Federal do Amazonas, Manaus, 2013. http://tede.ufam.edu.br/handle/tede/2925 |
identifier_str_mv |
SANCHEZ, Pedro Antonio Gonzales. Aprendendo funções de ranking baseadas em blocos usando programação genética. 2013. 50 f. Dissertação (Mestrado em Informática) - Universidade Federal do Amazonas, Manaus, 2013. |
url |
http://tede.ufam.edu.br/handle/tede/2925 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade Federal do Amazonas Instituto de Computação BR UFAM Programa de Pós-graduação em Informática |
publisher.none.fl_str_mv |
Universidade Federal do Amazonas Instituto de Computação BR UFAM Programa de Pós-graduação em Informática |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UFAM instname:Universidade Federal do Amazonas (UFAM) instacron:UFAM |
instname_str |
Universidade Federal do Amazonas (UFAM) |
instacron_str |
UFAM |
institution |
UFAM |
reponame_str |
Biblioteca Digital de Teses e Dissertações da UFAM |
collection |
Biblioteca Digital de Teses e Dissertações da UFAM |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UFAM - Universidade Federal do Amazonas (UFAM) |
repository.mail.fl_str_mv |
ddbc@ufam.edu.br||ddbc@ufam.edu.br |
_version_ |
1809732004017602560 |