Uma abordagem evolutiva para recuperação de imagens da web

Detalhes bibliográficos
Autor(a) principal: Katia Cristina Lage dos Santos
Data de Publicação: 2009
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFMG
Texto Completo: http://hdl.handle.net/1843/SLSS-7WMNMH
Resumo: Os avanços no armazenamento de dados e nas tecnologias para aquisição de imagens tornaram possível a criação de grandes bases ou coleções de imagens. Além disso, o enorme sucesso da Web tem proporcionado baixo custo e acessibilidade em larga escala deste material. Aliado a esses fatores, uma variedade de atividades lucrativas demandam transferência de informação baseada em imagem. Exemplos típicos são projetos arquitetônicos, desenhos de engenharia e de moda, perfumes, novos carros, campanhas de marketing, páginas da Internet, etc. Todas essas necessidades têm levado a um crescimento do interesse em organizar, indexar e consultar imagens digitais na última década.O problema conhecido na literatura relacionada como o Problema de Recuperação de Imagem pode ser enunciado da seguinte maneira: a partir de uma coleção formada por imagens, é realizada uma consulta por um usuário, sendo esta formada por evidências textuais e/ou de conteúdo relacionados a uma imagem, defina o conjunto-resposta mais relevante para aquela consulta. Esta tarefa é desafiadora, dada a dificuldade em se definir quais as evidências são as mais relevantes para a indexação de informações sobre as imagens da coleção. Uma dificuldade imediata consiste em ordenar o conjunto-resposta com relação a uma consulta do usuário.A partir da contextualização anterior, o presente trabalho apresenta um arcabouço evolucionário para recuperação de imagens. Este opera a partir da combinação de múltiplas evidências textuais e utiliza os preceitos da Programação Genética (PG), técnica da Inteligência Artificial. A PG é baseada na idéia de melhoramento contínuo da qualidade de uma solução para o problema em análise, a partir de soluções anteriores. Nossa motivação, portanto, é contribuir com o desenvolvimento de mecanismos de busca capazes de recuperar de uma maneira mais eficaz as imagens de uma coleção, no caso da World Wide Web. Como resultado prático, uma consulta realizada pelo usuário desse sistema de recuperação de imagens terá como resultado imagens mais relevantes sob a ótica do próprio usuário, aumentando assim o grau de satisfação e confiança do usuário no sistema de busca. Dentre os desafios advindos com a utilização dessa coleção podem ser mecionados: a heterogeneidade dos tipos de imagens, a inexistência de padronização no preenchimento das tags HTML onde as imagens são inseridas, a inclusão de referências incorretas para outro documento HTML, dentre outros. Experimentos realizados com uma coleção extraída da Web mostraram que, comparado com o Modelo Bayesiano apresentado em berthier, o arcabouço evolucionário apresentou um desempenho duas vezes maior, considerando as medidas de precisão, revocação e MAP. Estas são métricas importantes para avaliação da qualidade das imagens retornadas a partir de uma consulta. Além disso, a solução computacional desenvolvida neste trabalho apresenta uma grande flexibilidade, uma vez que em trabalhos futuros poderão ser adicionadas novas evidências com um custo mínimo de manutenção, além da possibilidade de ser empregada para a recuperação de imagens pertencentes a coleções existentes em outros contextos como uma coleção formada por imagens médicas.
id UFMG_75013ab7534b8098bec395d05f85577f
oai_identifier_str oai:repositorio.ufmg.br:1843/SLSS-7WMNMH
network_acronym_str UFMG
network_name_str Repositório Institucional da UFMG
repository_id_str
spelling Marcos Andre GoncalvesRicardo da Silva TorresRicardo da Silva TorresJoão Marcos Bastos CavalcantiGisele Lobo PappaKatia Cristina Lage dos Santos2019-08-12T16:24:50Z2019-08-12T16:24:50Z2009-05-29http://hdl.handle.net/1843/SLSS-7WMNMHOs avanços no armazenamento de dados e nas tecnologias para aquisição de imagens tornaram possível a criação de grandes bases ou coleções de imagens. Além disso, o enorme sucesso da Web tem proporcionado baixo custo e acessibilidade em larga escala deste material. Aliado a esses fatores, uma variedade de atividades lucrativas demandam transferência de informação baseada em imagem. Exemplos típicos são projetos arquitetônicos, desenhos de engenharia e de moda, perfumes, novos carros, campanhas de marketing, páginas da Internet, etc. Todas essas necessidades têm levado a um crescimento do interesse em organizar, indexar e consultar imagens digitais na última década.O problema conhecido na literatura relacionada como o Problema de Recuperação de Imagem pode ser enunciado da seguinte maneira: a partir de uma coleção formada por imagens, é realizada uma consulta por um usuário, sendo esta formada por evidências textuais e/ou de conteúdo relacionados a uma imagem, defina o conjunto-resposta mais relevante para aquela consulta. Esta tarefa é desafiadora, dada a dificuldade em se definir quais as evidências são as mais relevantes para a indexação de informações sobre as imagens da coleção. Uma dificuldade imediata consiste em ordenar o conjunto-resposta com relação a uma consulta do usuário.A partir da contextualização anterior, o presente trabalho apresenta um arcabouço evolucionário para recuperação de imagens. Este opera a partir da combinação de múltiplas evidências textuais e utiliza os preceitos da Programação Genética (PG), técnica da Inteligência Artificial. A PG é baseada na idéia de melhoramento contínuo da qualidade de uma solução para o problema em análise, a partir de soluções anteriores. Nossa motivação, portanto, é contribuir com o desenvolvimento de mecanismos de busca capazes de recuperar de uma maneira mais eficaz as imagens de uma coleção, no caso da World Wide Web. Como resultado prático, uma consulta realizada pelo usuário desse sistema de recuperação de imagens terá como resultado imagens mais relevantes sob a ótica do próprio usuário, aumentando assim o grau de satisfação e confiança do usuário no sistema de busca. Dentre os desafios advindos com a utilização dessa coleção podem ser mecionados: a heterogeneidade dos tipos de imagens, a inexistência de padronização no preenchimento das tags HTML onde as imagens são inseridas, a inclusão de referências incorretas para outro documento HTML, dentre outros. Experimentos realizados com uma coleção extraída da Web mostraram que, comparado com o Modelo Bayesiano apresentado em berthier, o arcabouço evolucionário apresentou um desempenho duas vezes maior, considerando as medidas de precisão, revocação e MAP. Estas são métricas importantes para avaliação da qualidade das imagens retornadas a partir de uma consulta. Além disso, a solução computacional desenvolvida neste trabalho apresenta uma grande flexibilidade, uma vez que em trabalhos futuros poderão ser adicionadas novas evidências com um custo mínimo de manutenção, além da possibilidade de ser empregada para a recuperação de imagens pertencentes a coleções existentes em outros contextos como uma coleção formada por imagens médicas.The developments in data storage and image acquisition technologies made the creation of huge databases or image collections possible. Moreover, the Web has been providing low cost and large scale acessibility to this material. Along with these factors, a variety of profitable activities demand image-based information. Typical examples are architectural projects, engineering and fashion designs, perfumes, new car models, marketing campaings and Internet sites, among others. All these needs explain the increasing in the interest in organizing, indexing, and retrieving digital images in the last decade.This problem can be simply described as follows: given a textual or a image-based query, supplied by the user to a system which contains a image database, define the most relevant answer-set to the query.This is a challenging task due to the difficulty in extracting from the image sources the `best' information needed for their representation and indexing. This work presents a evolutionary framework for image retrieval based on the combination of multiple textual sources of evidence. It explores the Genetic Programming concepts, based on the continuous improvement of the solution quality for a given problem. Therefore, our motivation is to contribute with the development of search mecanisms capable of representing, in a more reliable manner, images in the the WWW. As a pratical result, a query made to this system will have more relevant images as result, increasing the user satisfaction and confidence on the search system.Experiments performed with a collection extracted from the Web showed that, compared to the Bayesian Model presented in ~\citep{berthier} to solve the same problem, the evolutionary framework presents a performance twice as good, under precision, recall and MAP. These are important metrics to evaluate the quality of a image set returned from a query. Besides, the computational solution developed in this work presents great flexibility since the adition of new sources of evidences will be allowed with a minimum cost, besides the possibility to use the framework to retrieve images from other collections.Universidade Federal de Minas GeraisUFMGrecuperação de imagenswebUma abordagem evolutiva para recuperação de imagens da webinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINALkatialagedossantos.pdfapplication/pdf1429917https://repositorio.ufmg.br/bitstream/1843/SLSS-7WMNMH/1/katialagedossantos.pdfb96ab720ecb16feace35435315080b89MD51TEXTkatialagedossantos.pdf.txtkatialagedossantos.pdf.txtExtracted texttext/plain124357https://repositorio.ufmg.br/bitstream/1843/SLSS-7WMNMH/2/katialagedossantos.pdf.txt7db2b3daf282e53bbe773e2d411cf72dMD521843/SLSS-7WMNMH2019-11-14 18:34:11.276oai:repositorio.ufmg.br:1843/SLSS-7WMNMHRepositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2019-11-14T21:34:11Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false
dc.title.pt_BR.fl_str_mv Uma abordagem evolutiva para recuperação de imagens da web
title Uma abordagem evolutiva para recuperação de imagens da web
spellingShingle Uma abordagem evolutiva para recuperação de imagens da web
Katia Cristina Lage dos Santos
recuperação de imagens
web
title_short Uma abordagem evolutiva para recuperação de imagens da web
title_full Uma abordagem evolutiva para recuperação de imagens da web
title_fullStr Uma abordagem evolutiva para recuperação de imagens da web
title_full_unstemmed Uma abordagem evolutiva para recuperação de imagens da web
title_sort Uma abordagem evolutiva para recuperação de imagens da web
author Katia Cristina Lage dos Santos
author_facet Katia Cristina Lage dos Santos
author_role author
dc.contributor.advisor1.fl_str_mv Marcos Andre Goncalves
dc.contributor.advisor-co1.fl_str_mv Ricardo da Silva Torres
dc.contributor.referee1.fl_str_mv Ricardo da Silva Torres
dc.contributor.referee2.fl_str_mv João Marcos Bastos Cavalcanti
dc.contributor.referee3.fl_str_mv Gisele Lobo Pappa
dc.contributor.author.fl_str_mv Katia Cristina Lage dos Santos
contributor_str_mv Marcos Andre Goncalves
Ricardo da Silva Torres
Ricardo da Silva Torres
João Marcos Bastos Cavalcanti
Gisele Lobo Pappa
dc.subject.por.fl_str_mv recuperação de imagens
web
topic recuperação de imagens
web
description Os avanços no armazenamento de dados e nas tecnologias para aquisição de imagens tornaram possível a criação de grandes bases ou coleções de imagens. Além disso, o enorme sucesso da Web tem proporcionado baixo custo e acessibilidade em larga escala deste material. Aliado a esses fatores, uma variedade de atividades lucrativas demandam transferência de informação baseada em imagem. Exemplos típicos são projetos arquitetônicos, desenhos de engenharia e de moda, perfumes, novos carros, campanhas de marketing, páginas da Internet, etc. Todas essas necessidades têm levado a um crescimento do interesse em organizar, indexar e consultar imagens digitais na última década.O problema conhecido na literatura relacionada como o Problema de Recuperação de Imagem pode ser enunciado da seguinte maneira: a partir de uma coleção formada por imagens, é realizada uma consulta por um usuário, sendo esta formada por evidências textuais e/ou de conteúdo relacionados a uma imagem, defina o conjunto-resposta mais relevante para aquela consulta. Esta tarefa é desafiadora, dada a dificuldade em se definir quais as evidências são as mais relevantes para a indexação de informações sobre as imagens da coleção. Uma dificuldade imediata consiste em ordenar o conjunto-resposta com relação a uma consulta do usuário.A partir da contextualização anterior, o presente trabalho apresenta um arcabouço evolucionário para recuperação de imagens. Este opera a partir da combinação de múltiplas evidências textuais e utiliza os preceitos da Programação Genética (PG), técnica da Inteligência Artificial. A PG é baseada na idéia de melhoramento contínuo da qualidade de uma solução para o problema em análise, a partir de soluções anteriores. Nossa motivação, portanto, é contribuir com o desenvolvimento de mecanismos de busca capazes de recuperar de uma maneira mais eficaz as imagens de uma coleção, no caso da World Wide Web. Como resultado prático, uma consulta realizada pelo usuário desse sistema de recuperação de imagens terá como resultado imagens mais relevantes sob a ótica do próprio usuário, aumentando assim o grau de satisfação e confiança do usuário no sistema de busca. Dentre os desafios advindos com a utilização dessa coleção podem ser mecionados: a heterogeneidade dos tipos de imagens, a inexistência de padronização no preenchimento das tags HTML onde as imagens são inseridas, a inclusão de referências incorretas para outro documento HTML, dentre outros. Experimentos realizados com uma coleção extraída da Web mostraram que, comparado com o Modelo Bayesiano apresentado em berthier, o arcabouço evolucionário apresentou um desempenho duas vezes maior, considerando as medidas de precisão, revocação e MAP. Estas são métricas importantes para avaliação da qualidade das imagens retornadas a partir de uma consulta. Além disso, a solução computacional desenvolvida neste trabalho apresenta uma grande flexibilidade, uma vez que em trabalhos futuros poderão ser adicionadas novas evidências com um custo mínimo de manutenção, além da possibilidade de ser empregada para a recuperação de imagens pertencentes a coleções existentes em outros contextos como uma coleção formada por imagens médicas.
publishDate 2009
dc.date.issued.fl_str_mv 2009-05-29
dc.date.accessioned.fl_str_mv 2019-08-12T16:24:50Z
dc.date.available.fl_str_mv 2019-08-12T16:24:50Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/1843/SLSS-7WMNMH
url http://hdl.handle.net/1843/SLSS-7WMNMH
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.publisher.initials.fl_str_mv UFMG
publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFMG
instname:Universidade Federal de Minas Gerais (UFMG)
instacron:UFMG
instname_str Universidade Federal de Minas Gerais (UFMG)
instacron_str UFMG
institution UFMG
reponame_str Repositório Institucional da UFMG
collection Repositório Institucional da UFMG
bitstream.url.fl_str_mv https://repositorio.ufmg.br/bitstream/1843/SLSS-7WMNMH/1/katialagedossantos.pdf
https://repositorio.ufmg.br/bitstream/1843/SLSS-7WMNMH/2/katialagedossantos.pdf.txt
bitstream.checksum.fl_str_mv b96ab720ecb16feace35435315080b89
7db2b3daf282e53bbe773e2d411cf72d
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)
repository.mail.fl_str_mv
_version_ 1803589535860260864