Uma abordagem de componentes combinados para geração de funções de ordenação usando programação genética

Humberto Mossri de Almeida

Uma abordagem de componentes combinados para geração de funções de ordenação usando programação genética

Detalhes bibliográficos
Autor(a) principal:	Humberto Mossri de Almeida
Data de Publicação:	2007
Tipo de documento:	Dissertação
Idioma:	por
Título da fonte:	Repositório Institucional da UFMG
Texto Completo:	http://hdl.handle.net/1843/RVMR-795PD3
Resumo:	Com o advento da Web e de outros repositórios de informação, como Bibliotecas Digitais, a tarefa de recuperação de informação transformou-se em um problema extremamente complexo e desafiador. Neste contexto, as máquinas de busca surgiram como ferramentas fundamentais para a tarefa de recuperação de informação em uma coleção de documentos. Estas ferramentas são baseadas em modelos de recuperação de informação, cujo principal objetivo é definir a ordem na qual os documentos são retornados para os usuários em resposta a uma consulta, através de uma função de ordenação. Diversas funções de ordenação têm sido investigadas ao longo dos anos. No entanto, a maioria delas tem um caráter geral, isto é, são projetadas para serem efetivas em qualquer coleção.Neste trabalho é proposto um novo método para descobrir funções de ordenação adaptadas a uma coleção baseado em Programação Genética (GP). O processo evolutivo da Abordagem de Componentes Combinados (CCA), proposta por este trabalho, diferentemente de outras abordagens baseadas em GP, utiliza componentes de diferentes funções de ordenação comprovadamente eficazes e conhecidas da literatura de recuperação de informação. Parte-se da hipótese de que estes componentes são individualmente representativos e ricos de significado e podem ser combinados para a geração de uma nova função de ordenação mais efetiva e específica para uma determinada coleção.Os resultados experimentais mostram que a abordagem CCA foi capaz de superar em até 40% as abordagens clássicas da literatura tais como tf-idf, BM25 e outra abordagem baseada em GP (denominada FAN-GP) em duas coleções diferentes. O processo evolutivo CCA também foi capaz de reduzir o problema do 'treinamento exagerado', geralmente encontrado em métodos de aprendizado de máquina, especialmente programação genética.

Metadados do item

id	UFMG_3b3448a24de77303be43d97773c77cc9
oai_identifier_str	oai:repositorio.ufmg.br:1843/RVMR-795PD3
network_acronym_str	UFMG
network_name_str	Repositório Institucional da UFMG
repository_id_str
spelling	Marcos Andre GoncalvesAndré Carlos Ponce de L.F. de CarvalhoAlberto Henrique Frade LaenderNivio ZivianiHumberto Mossri de Almeida2019-08-11T16:17:55Z2019-08-11T16:17:55Z2007-06-15http://hdl.handle.net/1843/RVMR-795PD3Com o advento da Web e de outros repositórios de informação, como Bibliotecas Digitais, a tarefa de recuperação de informação transformou-se em um problema extremamente complexo e desafiador. Neste contexto, as máquinas de busca surgiram como ferramentas fundamentais para a tarefa de recuperação de informação em uma coleção de documentos. Estas ferramentas são baseadas em modelos de recuperação de informação, cujo principal objetivo é definir a ordem na qual os documentos são retornados para os usuários em resposta a uma consulta, através de uma função de ordenação. Diversas funções de ordenação têm sido investigadas ao longo dos anos. No entanto, a maioria delas tem um caráter geral, isto é, são projetadas para serem efetivas em qualquer coleção.Neste trabalho é proposto um novo método para descobrir funções de ordenação adaptadas a uma coleção baseado em Programação Genética (GP). O processo evolutivo da Abordagem de Componentes Combinados (CCA), proposta por este trabalho, diferentemente de outras abordagens baseadas em GP, utiliza componentes de diferentes funções de ordenação comprovadamente eficazes e conhecidas da literatura de recuperação de informação. Parte-se da hipótese de que estes componentes são individualmente representativos e ricos de significado e podem ser combinados para a geração de uma nova função de ordenação mais efetiva e específica para uma determinada coleção.Os resultados experimentais mostram que a abordagem CCA foi capaz de superar em até 40% as abordagens clássicas da literatura tais como tf-idf, BM25 e outra abordagem baseada em GP (denominada FAN-GP) em duas coleções diferentes. O processo evolutivo CCA também foi capaz de reduzir o problema do 'treinamento exagerado', geralmente encontrado em métodos de aprendizado de máquina, especialmente programação genética.Due to the advent of the Web and other textual repositories, such as digital libraries, the information retrieval task has become a very complex and challenging problem. In this context, search engines became valuable tools for the information retrieval task in document collections. These tools are based on information retrieval models whose main goal is to produce, given a query, a set of documents ranked by relevance as an answer. For doing so, the so-called ranking functions are employed. Several ranking functions have been investigated throughout the years. However, most of them attempt to be very general in nature, i.e., they were designed to be effective in any type of collection. In this work, we propose a new method to discover collection-adapted ranking functions based on Genetic Programming (GP). The evolution process of our Combined Component Approach (CCA), differently from other approaches based on GP, uses several components extracted from effective and well-known ranking functions. Our assumption is that these components are representative and meaningful and can be combined for generating a more effective and specific new ranking function for a given document collection. Experimental results show that our approach was able to outperform in more than 40% standard TF-IDF, BM25 and other GP-based approach (named FAN-GP) in two different collections. The CCA evolution process also was able to reduce the overtraining, commonly found in machine learning methods, especially genetic programming.Universidade Federal de Minas GeraisUFMGComputadores digitais ProgramaçãoProgramação genética (Computação)ComputaçãoSistemas de recuperação da informaçãoAlgoritmos geneticosRecuperação de InformaçãoPonderação de TermosAprendizado de MáquinaFunções de OrdenaçãoProgramação GenéticaUma abordagem de componentes combinados para geração de funções de ordenação usando programação genéticainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINALhumbertomossri.pdfapplication/pdf751151https://repositorio.ufmg.br/bitstream/1843/RVMR-795PD3/1/humbertomossri.pdf3038ae900b282ee6a7e68b71bc6dae01MD51TEXThumbertomossri.pdf.txthumbertomossri.pdf.txtExtracted texttext/plain131877https://repositorio.ufmg.br/bitstream/1843/RVMR-795PD3/2/humbertomossri.pdf.txtda21d2a98d24ecb980c867d9cdf41303MD521843/RVMR-795PD32019-11-14 07:12:26.101oai:repositorio.ufmg.br:1843/RVMR-795PD3Repositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2019-11-14T10:12:26Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false
dc.title.pt_BR.fl_str_mv	Uma abordagem de componentes combinados para geração de funções de ordenação usando programação genética
title	Uma abordagem de componentes combinados para geração de funções de ordenação usando programação genética
spellingShingle	Uma abordagem de componentes combinados para geração de funções de ordenação usando programação genética Humberto Mossri de Almeida Recuperação de Informação Ponderação de Termos Aprendizado de Máquina Funções de Ordenação Programação Genética Computadores digitais Programação Programação genética (Computação) Computação Sistemas de recuperação da informação Algoritmos geneticos
title_short	Uma abordagem de componentes combinados para geração de funções de ordenação usando programação genética
title_full	Uma abordagem de componentes combinados para geração de funções de ordenação usando programação genética
title_fullStr	Uma abordagem de componentes combinados para geração de funções de ordenação usando programação genética
title_full_unstemmed	Uma abordagem de componentes combinados para geração de funções de ordenação usando programação genética
title_sort	Uma abordagem de componentes combinados para geração de funções de ordenação usando programação genética
author	Humberto Mossri de Almeida
author_facet	Humberto Mossri de Almeida
author_role	author
dc.contributor.advisor1.fl_str_mv	Marcos Andre Goncalves
dc.contributor.referee1.fl_str_mv	André Carlos Ponce de L.F. de Carvalho
dc.contributor.referee2.fl_str_mv	Alberto Henrique Frade Laender
dc.contributor.referee3.fl_str_mv	Nivio Ziviani
dc.contributor.author.fl_str_mv	Humberto Mossri de Almeida
contributor_str_mv	Marcos Andre Goncalves André Carlos Ponce de L.F. de Carvalho Alberto Henrique Frade Laender Nivio Ziviani
dc.subject.por.fl_str_mv	Recuperação de Informação Ponderação de Termos Aprendizado de Máquina Funções de Ordenação Programação Genética
topic	Recuperação de Informação Ponderação de Termos Aprendizado de Máquina Funções de Ordenação Programação Genética Computadores digitais Programação Programação genética (Computação) Computação Sistemas de recuperação da informação Algoritmos geneticos
dc.subject.other.pt_BR.fl_str_mv	Computadores digitais Programação Programação genética (Computação) Computação Sistemas de recuperação da informação Algoritmos geneticos
description	Com o advento da Web e de outros repositórios de informação, como Bibliotecas Digitais, a tarefa de recuperação de informação transformou-se em um problema extremamente complexo e desafiador. Neste contexto, as máquinas de busca surgiram como ferramentas fundamentais para a tarefa de recuperação de informação em uma coleção de documentos. Estas ferramentas são baseadas em modelos de recuperação de informação, cujo principal objetivo é definir a ordem na qual os documentos são retornados para os usuários em resposta a uma consulta, através de uma função de ordenação. Diversas funções de ordenação têm sido investigadas ao longo dos anos. No entanto, a maioria delas tem um caráter geral, isto é, são projetadas para serem efetivas em qualquer coleção.Neste trabalho é proposto um novo método para descobrir funções de ordenação adaptadas a uma coleção baseado em Programação Genética (GP). O processo evolutivo da Abordagem de Componentes Combinados (CCA), proposta por este trabalho, diferentemente de outras abordagens baseadas em GP, utiliza componentes de diferentes funções de ordenação comprovadamente eficazes e conhecidas da literatura de recuperação de informação. Parte-se da hipótese de que estes componentes são individualmente representativos e ricos de significado e podem ser combinados para a geração de uma nova função de ordenação mais efetiva e específica para uma determinada coleção.Os resultados experimentais mostram que a abordagem CCA foi capaz de superar em até 40% as abordagens clássicas da literatura tais como tf-idf, BM25 e outra abordagem baseada em GP (denominada FAN-GP) em duas coleções diferentes. O processo evolutivo CCA também foi capaz de reduzir o problema do 'treinamento exagerado', geralmente encontrado em métodos de aprendizado de máquina, especialmente programação genética.
publishDate	2007
dc.date.issued.fl_str_mv	2007-06-15
dc.date.accessioned.fl_str_mv	2019-08-11T16:17:55Z
dc.date.available.fl_str_mv	2019-08-11T16:17:55Z
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	http://hdl.handle.net/1843/RVMR-795PD3
url	http://hdl.handle.net/1843/RVMR-795PD3
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.publisher.none.fl_str_mv	Universidade Federal de Minas Gerais
dc.publisher.initials.fl_str_mv	UFMG
publisher.none.fl_str_mv	Universidade Federal de Minas Gerais
dc.source.none.fl_str_mv	reponame:Repositório Institucional da UFMG instname:Universidade Federal de Minas Gerais (UFMG) instacron:UFMG
instname_str	Universidade Federal de Minas Gerais (UFMG)
instacron_str	UFMG
institution	UFMG
reponame_str	Repositório Institucional da UFMG
collection	Repositório Institucional da UFMG
bitstream.url.fl_str_mv	https://repositorio.ufmg.br/bitstream/1843/RVMR-795PD3/1/humbertomossri.pdf https://repositorio.ufmg.br/bitstream/1843/RVMR-795PD3/2/humbertomossri.pdf.txt
bitstream.checksum.fl_str_mv	3038ae900b282ee6a7e68b71bc6dae01 da21d2a98d24ecb980c867d9cdf41303
bitstream.checksumAlgorithm.fl_str_mv	MD5 MD5
repository.name.fl_str_mv	Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)
repository.mail.fl_str_mv
_version_	1803589187271655424

Uma abordagem de componentes combinados para geração de funções de ordenação usando programação genética

Registros relacionados