Uma abordagem evolutiva para recuperação de imagens da web

Katia Cristina Lage dos Santos

Uma abordagem evolutiva para recuperação de imagens da web

Detalhes bibliográficos
Autor(a) principal:	Katia Cristina Lage dos Santos
Data de Publicação:	2009
Tipo de documento:	Dissertação
Idioma:	por
Título da fonte:	Repositório Institucional da UFMG
Texto Completo:	http://hdl.handle.net/1843/SLSS-7WMNMH
Resumo:	Os avanços no armazenamento de dados e nas tecnologias para aquisição de imagens tornaram possível a criação de grandes bases ou coleções de imagens. Além disso, o enorme sucesso da Web tem proporcionado baixo custo e acessibilidade em larga escala deste material. Aliado a esses fatores, uma variedade de atividades lucrativas demandam transferência de informação baseada em imagem. Exemplos típicos são projetos arquitetônicos, desenhos de engenharia e de moda, perfumes, novos carros, campanhas de marketing, páginas da Internet, etc. Todas essas necessidades têm levado a um crescimento do interesse em organizar, indexar e consultar imagens digitais na última década.O problema conhecido na literatura relacionada como o Problema de Recuperação de Imagem pode ser enunciado da seguinte maneira: a partir de uma coleção formada por imagens, é realizada uma consulta por um usuário, sendo esta formada por evidências textuais e/ou de conteúdo relacionados a uma imagem, defina o conjunto-resposta mais relevante para aquela consulta. Esta tarefa é desafiadora, dada a dificuldade em se definir quais as evidências são as mais relevantes para a indexação de informações sobre as imagens da coleção. Uma dificuldade imediata consiste em ordenar o conjunto-resposta com relação a uma consulta do usuário.A partir da contextualização anterior, o presente trabalho apresenta um arcabouço evolucionário para recuperação de imagens. Este opera a partir da combinação de múltiplas evidências textuais e utiliza os preceitos da Programação Genética (PG), técnica da Inteligência Artificial. A PG é baseada na idéia de melhoramento contínuo da qualidade de uma solução para o problema em análise, a partir de soluções anteriores. Nossa motivação, portanto, é contribuir com o desenvolvimento de mecanismos de busca capazes de recuperar de uma maneira mais eficaz as imagens de uma coleção, no caso da World Wide Web. Como resultado prático, uma consulta realizada pelo usuário desse sistema de recuperação de imagens terá como resultado imagens mais relevantes sob a ótica do próprio usuário, aumentando assim o grau de satisfação e confiança do usuário no sistema de busca. Dentre os desafios advindos com a utilização dessa coleção podem ser mecionados: a heterogeneidade dos tipos de imagens, a inexistência de padronização no preenchimento das tags HTML onde as imagens são inseridas, a inclusão de referências incorretas para outro documento HTML, dentre outros. Experimentos realizados com uma coleção extraída da Web mostraram que, comparado com o Modelo Bayesiano apresentado em berthier, o arcabouço evolucionário apresentou um desempenho duas vezes maior, considerando as medidas de precisão, revocação e MAP. Estas são métricas importantes para avaliação da qualidade das imagens retornadas a partir de uma consulta. Além disso, a solução computacional desenvolvida neste trabalho apresenta uma grande flexibilidade, uma vez que em trabalhos futuros poderão ser adicionadas novas evidências com um custo mínimo de manutenção, além da possibilidade de ser empregada para a recuperação de imagens pertencentes a coleções existentes em outros contextos como uma coleção formada por imagens médicas.

Metadados do item

id	UFMG_75013ab7534b8098bec395d05f85577f
oai_identifier_str	oai:repositorio.ufmg.br:1843/SLSS-7WMNMH
network_acronym_str	UFMG
network_name_str	Repositório Institucional da UFMG
repository_id_str
spelling	Marcos Andre GoncalvesRicardo da Silva TorresRicardo da Silva TorresJoão Marcos Bastos CavalcantiGisele Lobo PappaKatia Cristina Lage dos Santos2019-08-12T16:24:50Z2019-08-12T16:24:50Z2009-05-29http://hdl.handle.net/1843/SLSS-7WMNMHOs avanços no armazenamento de dados e nas tecnologias para aquisição de imagens tornaram possível a criação de grandes bases ou coleções de imagens. Além disso, o enorme sucesso da Web tem proporcionado baixo custo e acessibilidade em larga escala deste material. Aliado a esses fatores, uma variedade de atividades lucrativas demandam transferência de informação baseada em imagem. Exemplos típicos são projetos arquitetônicos, desenhos de engenharia e de moda, perfumes, novos carros, campanhas de marketing, páginas da Internet, etc. Todas essas necessidades têm levado a um crescimento do interesse em organizar, indexar e consultar imagens digitais na última década.O problema conhecido na literatura relacionada como o Problema de Recuperação de Imagem pode ser enunciado da seguinte maneira: a partir de uma coleção formada por imagens, é realizada uma consulta por um usuário, sendo esta formada por evidências textuais e/ou de conteúdo relacionados a uma imagem, defina o conjunto-resposta mais relevante para aquela consulta. Esta tarefa é desafiadora, dada a dificuldade em se definir quais as evidências são as mais relevantes para a indexação de informações sobre as imagens da coleção. Uma dificuldade imediata consiste em ordenar o conjunto-resposta com relação a uma consulta do usuário.A partir da contextualização anterior, o presente trabalho apresenta um arcabouço evolucionário para recuperação de imagens. Este opera a partir da combinação de múltiplas evidências textuais e utiliza os preceitos da Programação Genética (PG), técnica da Inteligência Artificial. A PG é baseada na idéia de melhoramento contínuo da qualidade de uma solução para o problema em análise, a partir de soluções anteriores. Nossa motivação, portanto, é contribuir com o desenvolvimento de mecanismos de busca capazes de recuperar de uma maneira mais eficaz as imagens de uma coleção, no caso da World Wide Web. Como resultado prático, uma consulta realizada pelo usuário desse sistema de recuperação de imagens terá como resultado imagens mais relevantes sob a ótica do próprio usuário, aumentando assim o grau de satisfação e confiança do usuário no sistema de busca. Dentre os desafios advindos com a utilização dessa coleção podem ser mecionados: a heterogeneidade dos tipos de imagens, a inexistência de padronização no preenchimento das tags HTML onde as imagens são inseridas, a inclusão de referências incorretas para outro documento HTML, dentre outros. Experimentos realizados com uma coleção extraída da Web mostraram que, comparado com o Modelo Bayesiano apresentado em berthier, o arcabouço evolucionário apresentou um desempenho duas vezes maior, considerando as medidas de precisão, revocação e MAP. Estas são métricas importantes para avaliação da qualidade das imagens retornadas a partir de uma consulta. Além disso, a solução computacional desenvolvida neste trabalho apresenta uma grande flexibilidade, uma vez que em trabalhos futuros poderão ser adicionadas novas evidências com um custo mínimo de manutenção, além da possibilidade de ser empregada para a recuperação de imagens pertencentes a coleções existentes em outros contextos como uma coleção formada por imagens médicas.The developments in data storage and image acquisition technologies made the creation of huge databases or image collections possible. Moreover, the Web has been providing low cost and large scale acessibility to this material. Along with these factors, a variety of profitable activities demand image-based information. Typical examples are architectural projects, engineering and fashion designs, perfumes, new car models, marketing campaings and Internet sites, among others. All these needs explain the increasing in the interest in organizing, indexing, and retrieving digital images in the last decade.This problem can be simply described as follows: given a textual or a image-based query, supplied by the user to a system which contains a image database, define the most relevant answer-set to the query.This is a challenging task due to the difficulty in extracting from the image sources the `best' information needed for their representation and indexing. This work presents a evolutionary framework for image retrieval based on the combination of multiple textual sources of evidence. It explores the Genetic Programming concepts, based on the continuous improvement of the solution quality for a given problem. Therefore, our motivation is to contribute with the development of search mecanisms capable of representing, in a more reliable manner, images in the the WWW. As a pratical result, a query made to this system will have more relevant images as result, increasing the user satisfaction and confidence on the search system.Experiments performed with a collection extracted from the Web showed that, compared to the Bayesian Model presented in ~\citep{berthier} to solve the same problem, the evolutionary framework presents a performance twice as good, under precision, recall and MAP. These are important metrics to evaluate the quality of a image set returned from a query. Besides, the computational solution developed in this work presents great flexibility since the adition of new sources of evidences will be allowed with a minimum cost, besides the possibility to use the framework to retrieve images from other collections.Universidade Federal de Minas GeraisUFMGrecuperação de imagenswebUma abordagem evolutiva para recuperação de imagens da webinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINALkatialagedossantos.pdfapplication/pdf1429917https://repositorio.ufmg.br/bitstream/1843/SLSS-7WMNMH/1/katialagedossantos.pdfb96ab720ecb16feace35435315080b89MD51TEXTkatialagedossantos.pdf.txtkatialagedossantos.pdf.txtExtracted texttext/plain124357https://repositorio.ufmg.br/bitstream/1843/SLSS-7WMNMH/2/katialagedossantos.pdf.txt7db2b3daf282e53bbe773e2d411cf72dMD521843/SLSS-7WMNMH2019-11-14 18:34:11.276oai:repositorio.ufmg.br:1843/SLSS-7WMNMHRepositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2019-11-14T21:34:11Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false
dc.title.pt_BR.fl_str_mv	Uma abordagem evolutiva para recuperação de imagens da web
title	Uma abordagem evolutiva para recuperação de imagens da web
spellingShingle	Uma abordagem evolutiva para recuperação de imagens da web Katia Cristina Lage dos Santos recuperação de imagens web
title_short	Uma abordagem evolutiva para recuperação de imagens da web
title_full	Uma abordagem evolutiva para recuperação de imagens da web
title_fullStr	Uma abordagem evolutiva para recuperação de imagens da web
title_full_unstemmed	Uma abordagem evolutiva para recuperação de imagens da web
title_sort	Uma abordagem evolutiva para recuperação de imagens da web
author	Katia Cristina Lage dos Santos
author_facet	Katia Cristina Lage dos Santos
author_role	author
dc.contributor.advisor1.fl_str_mv	Marcos Andre Goncalves
dc.contributor.advisor-co1.fl_str_mv	Ricardo da Silva Torres
dc.contributor.referee1.fl_str_mv	Ricardo da Silva Torres
dc.contributor.referee2.fl_str_mv	João Marcos Bastos Cavalcanti
dc.contributor.referee3.fl_str_mv	Gisele Lobo Pappa
dc.contributor.author.fl_str_mv	Katia Cristina Lage dos Santos
contributor_str_mv	Marcos Andre Goncalves Ricardo da Silva Torres Ricardo da Silva Torres João Marcos Bastos Cavalcanti Gisele Lobo Pappa
dc.subject.por.fl_str_mv	recuperação de imagens web
topic	recuperação de imagens web
description	Os avanços no armazenamento de dados e nas tecnologias para aquisição de imagens tornaram possível a criação de grandes bases ou coleções de imagens. Além disso, o enorme sucesso da Web tem proporcionado baixo custo e acessibilidade em larga escala deste material. Aliado a esses fatores, uma variedade de atividades lucrativas demandam transferência de informação baseada em imagem. Exemplos típicos são projetos arquitetônicos, desenhos de engenharia e de moda, perfumes, novos carros, campanhas de marketing, páginas da Internet, etc. Todas essas necessidades têm levado a um crescimento do interesse em organizar, indexar e consultar imagens digitais na última década.O problema conhecido na literatura relacionada como o Problema de Recuperação de Imagem pode ser enunciado da seguinte maneira: a partir de uma coleção formada por imagens, é realizada uma consulta por um usuário, sendo esta formada por evidências textuais e/ou de conteúdo relacionados a uma imagem, defina o conjunto-resposta mais relevante para aquela consulta. Esta tarefa é desafiadora, dada a dificuldade em se definir quais as evidências são as mais relevantes para a indexação de informações sobre as imagens da coleção. Uma dificuldade imediata consiste em ordenar o conjunto-resposta com relação a uma consulta do usuário.A partir da contextualização anterior, o presente trabalho apresenta um arcabouço evolucionário para recuperação de imagens. Este opera a partir da combinação de múltiplas evidências textuais e utiliza os preceitos da Programação Genética (PG), técnica da Inteligência Artificial. A PG é baseada na idéia de melhoramento contínuo da qualidade de uma solução para o problema em análise, a partir de soluções anteriores. Nossa motivação, portanto, é contribuir com o desenvolvimento de mecanismos de busca capazes de recuperar de uma maneira mais eficaz as imagens de uma coleção, no caso da World Wide Web. Como resultado prático, uma consulta realizada pelo usuário desse sistema de recuperação de imagens terá como resultado imagens mais relevantes sob a ótica do próprio usuário, aumentando assim o grau de satisfação e confiança do usuário no sistema de busca. Dentre os desafios advindos com a utilização dessa coleção podem ser mecionados: a heterogeneidade dos tipos de imagens, a inexistência de padronização no preenchimento das tags HTML onde as imagens são inseridas, a inclusão de referências incorretas para outro documento HTML, dentre outros. Experimentos realizados com uma coleção extraída da Web mostraram que, comparado com o Modelo Bayesiano apresentado em berthier, o arcabouço evolucionário apresentou um desempenho duas vezes maior, considerando as medidas de precisão, revocação e MAP. Estas são métricas importantes para avaliação da qualidade das imagens retornadas a partir de uma consulta. Além disso, a solução computacional desenvolvida neste trabalho apresenta uma grande flexibilidade, uma vez que em trabalhos futuros poderão ser adicionadas novas evidências com um custo mínimo de manutenção, além da possibilidade de ser empregada para a recuperação de imagens pertencentes a coleções existentes em outros contextos como uma coleção formada por imagens médicas.
publishDate	2009
dc.date.issued.fl_str_mv	2009-05-29
dc.date.accessioned.fl_str_mv	2019-08-12T16:24:50Z
dc.date.available.fl_str_mv	2019-08-12T16:24:50Z
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	http://hdl.handle.net/1843/SLSS-7WMNMH
url	http://hdl.handle.net/1843/SLSS-7WMNMH
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.publisher.none.fl_str_mv	Universidade Federal de Minas Gerais
dc.publisher.initials.fl_str_mv	UFMG
publisher.none.fl_str_mv	Universidade Federal de Minas Gerais
dc.source.none.fl_str_mv	reponame:Repositório Institucional da UFMG instname:Universidade Federal de Minas Gerais (UFMG) instacron:UFMG
instname_str	Universidade Federal de Minas Gerais (UFMG)
instacron_str	UFMG
institution	UFMG
reponame_str	Repositório Institucional da UFMG
collection	Repositório Institucional da UFMG
bitstream.url.fl_str_mv	https://repositorio.ufmg.br/bitstream/1843/SLSS-7WMNMH/1/katialagedossantos.pdf https://repositorio.ufmg.br/bitstream/1843/SLSS-7WMNMH/2/katialagedossantos.pdf.txt
bitstream.checksum.fl_str_mv	b96ab720ecb16feace35435315080b89 7db2b3daf282e53bbe773e2d411cf72d
bitstream.checksumAlgorithm.fl_str_mv	MD5 MD5
repository.name.fl_str_mv	Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)
repository.mail.fl_str_mv
_version_	1803589535860260864

Uma abordagem evolutiva para recuperação de imagens da web

Registros relacionados