Visão computacional : indexação automatizada de imagens

Detalhes bibliográficos
Autor(a) principal: Ferrugem, Anderson Priebe
Data de Publicação: 2004
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da UFRGS
Texto Completo: http://hdl.handle.net/10183/153228
Resumo: O avanço tecnológico atual está permitindo que as pessoas recebam cada vez mais informações visuais dos mais diferentes tipos, nas mais variadas mídias. Esse aumento fantástico está obrigando os pesquisadores e as indústrias a imaginar soluções para o armazenamento e recuperação deste tipo de informação, pois nossos computadores ainda utilizam, apesar dos grandes avanços nessa área, um sistema de arquivos imaginado há décadas, quando era natural trabalhar com informações meramente textuais. Agora, nos deparamos com novos problemas: Como encontrar uma paisagem específica em um banco de imagens, em que trecho de um filme aparece um cavalo sobre uma colina, em que parte da fotografia existe um gato, como fazer um robô localizar um objeto em uma cena, entre outras necessidades. O objetivo desse trabalho é propor uma arquitetura de rede neural artificial que permita o reconhecimento de objetos genéricos e de categorias em banco de imagens digitais, de forma que se possa recuperar imagens específicas a partir da descrição da cena fornecida pelo usuário. Para que esse objetivo fosse alcançado, foram utilizadas técnicas de Visão Computacional e Processamento de Imagens na etapa de extração de feições de baixo nível e de Redes Neurais(Mapas Auto-Organizáveis de Kohonen) na etapa de agrupamento de classes de objetos. O resultado final desse trabalho pretende ser um embrião para um sistema de reconhecimento de objetos mais genérico, que possa ser estendido para a criação de indices de forma automática ou semi-automática em grandes bancos de imagens.
id URGS_e2733f159ef26b56ee137e2330a6b726
oai_identifier_str oai:www.lume.ufrgs.br:10183/153228
network_acronym_str URGS
network_name_str Biblioteca Digital de Teses e Dissertações da UFRGS
repository_id_str 1853
spelling Ferrugem, Anderson PriebeBarone, Dante Augusto Couto2017-03-16T02:20:17Z2004http://hdl.handle.net/10183/153228001013821O avanço tecnológico atual está permitindo que as pessoas recebam cada vez mais informações visuais dos mais diferentes tipos, nas mais variadas mídias. Esse aumento fantástico está obrigando os pesquisadores e as indústrias a imaginar soluções para o armazenamento e recuperação deste tipo de informação, pois nossos computadores ainda utilizam, apesar dos grandes avanços nessa área, um sistema de arquivos imaginado há décadas, quando era natural trabalhar com informações meramente textuais. Agora, nos deparamos com novos problemas: Como encontrar uma paisagem específica em um banco de imagens, em que trecho de um filme aparece um cavalo sobre uma colina, em que parte da fotografia existe um gato, como fazer um robô localizar um objeto em uma cena, entre outras necessidades. O objetivo desse trabalho é propor uma arquitetura de rede neural artificial que permita o reconhecimento de objetos genéricos e de categorias em banco de imagens digitais, de forma que se possa recuperar imagens específicas a partir da descrição da cena fornecida pelo usuário. Para que esse objetivo fosse alcançado, foram utilizadas técnicas de Visão Computacional e Processamento de Imagens na etapa de extração de feições de baixo nível e de Redes Neurais(Mapas Auto-Organizáveis de Kohonen) na etapa de agrupamento de classes de objetos. O resultado final desse trabalho pretende ser um embrião para um sistema de reconhecimento de objetos mais genérico, que possa ser estendido para a criação de indices de forma automática ou semi-automática em grandes bancos de imagens.The current technological progress allows people to receive more and more visual information of the most different types, in different medias. This huge augmentation of image availability forces researchers and industries to propose efficient solutions for image storage and recovery. Despite the extraordinary advances in computational power, the data files system remain the same for decades, when it was natural to deal only with textual information. Nowadays, new problems are in front of us in this field. For instance, how can we find an specific landscape in a image database, in which place of a movie there is a horse on a hill, in which part of a photographic picture there is a cat, how can a robot find an object in a scene, among other queries. The objective of this work is to propose an Artificial Neural Network (ANN) architecture that performs the recognition of generic objects and object’s categories in a digital image database. With this implementation, it becomes possible to do image retrieval through the user´s scene description. To achieve our goal, we have used Computer Vision and Image Processing techniques in low level features extraction and Neural Networks (namely Kohonen’s Self-Organizing Maps) in the phase of object classes clustering. The main result of this work aims to be a seed for a more generic object recognition system, which can be extended to the automatic or semi-automatic index creation in huge image databases.application/pdfporComputação gráficaVisão computacionalProcessamento de imagensImage retrievalComputer visionSelf-Organizing mapsSOMVisão computacional : indexação automatizada de imagensComputer vision : automated indexing of imagesinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPrograma de Pós-Graduação em ComputaçãoPorto Alegre, BR-RS2004mestradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSORIGINAL001013821.pdf001013821.pdfTexto completoapplication/pdf1063408http://www.lume.ufrgs.br/bitstream/10183/153228/1/001013821.pdf91007d2543f6820dc7c55f7cb353828cMD51TEXT001013821.pdf.txt001013821.pdf.txtExtracted Texttext/plain174761http://www.lume.ufrgs.br/bitstream/10183/153228/2/001013821.pdf.txt6c7cae7d48c80e849154ecdb0884a290MD52THUMBNAIL001013821.pdf.jpg001013821.pdf.jpgGenerated Thumbnailimage/jpeg1030http://www.lume.ufrgs.br/bitstream/10183/153228/3/001013821.pdf.jpg9b7cd8a1fb137a482ba5db5d611b502bMD5310183/1532282022-02-22 04:48:31.178419oai:www.lume.ufrgs.br:10183/153228Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532022-02-22T07:48:31Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Visão computacional : indexação automatizada de imagens
dc.title.alternative.en.fl_str_mv Computer vision : automated indexing of images
title Visão computacional : indexação automatizada de imagens
spellingShingle Visão computacional : indexação automatizada de imagens
Ferrugem, Anderson Priebe
Computação gráfica
Visão computacional
Processamento de imagens
Image retrieval
Computer vision
Self-Organizing maps
SOM
title_short Visão computacional : indexação automatizada de imagens
title_full Visão computacional : indexação automatizada de imagens
title_fullStr Visão computacional : indexação automatizada de imagens
title_full_unstemmed Visão computacional : indexação automatizada de imagens
title_sort Visão computacional : indexação automatizada de imagens
author Ferrugem, Anderson Priebe
author_facet Ferrugem, Anderson Priebe
author_role author
dc.contributor.author.fl_str_mv Ferrugem, Anderson Priebe
dc.contributor.advisor1.fl_str_mv Barone, Dante Augusto Couto
contributor_str_mv Barone, Dante Augusto Couto
dc.subject.por.fl_str_mv Computação gráfica
Visão computacional
Processamento de imagens
topic Computação gráfica
Visão computacional
Processamento de imagens
Image retrieval
Computer vision
Self-Organizing maps
SOM
dc.subject.eng.fl_str_mv Image retrieval
Computer vision
Self-Organizing maps
SOM
description O avanço tecnológico atual está permitindo que as pessoas recebam cada vez mais informações visuais dos mais diferentes tipos, nas mais variadas mídias. Esse aumento fantástico está obrigando os pesquisadores e as indústrias a imaginar soluções para o armazenamento e recuperação deste tipo de informação, pois nossos computadores ainda utilizam, apesar dos grandes avanços nessa área, um sistema de arquivos imaginado há décadas, quando era natural trabalhar com informações meramente textuais. Agora, nos deparamos com novos problemas: Como encontrar uma paisagem específica em um banco de imagens, em que trecho de um filme aparece um cavalo sobre uma colina, em que parte da fotografia existe um gato, como fazer um robô localizar um objeto em uma cena, entre outras necessidades. O objetivo desse trabalho é propor uma arquitetura de rede neural artificial que permita o reconhecimento de objetos genéricos e de categorias em banco de imagens digitais, de forma que se possa recuperar imagens específicas a partir da descrição da cena fornecida pelo usuário. Para que esse objetivo fosse alcançado, foram utilizadas técnicas de Visão Computacional e Processamento de Imagens na etapa de extração de feições de baixo nível e de Redes Neurais(Mapas Auto-Organizáveis de Kohonen) na etapa de agrupamento de classes de objetos. O resultado final desse trabalho pretende ser um embrião para um sistema de reconhecimento de objetos mais genérico, que possa ser estendido para a criação de indices de forma automática ou semi-automática em grandes bancos de imagens.
publishDate 2004
dc.date.issued.fl_str_mv 2004
dc.date.accessioned.fl_str_mv 2017-03-16T02:20:17Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/153228
dc.identifier.nrb.pt_BR.fl_str_mv 001013821
url http://hdl.handle.net/10183/153228
identifier_str_mv 001013821
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Biblioteca Digital de Teses e Dissertações da UFRGS
collection Biblioteca Digital de Teses e Dissertações da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/153228/1/001013821.pdf
http://www.lume.ufrgs.br/bitstream/10183/153228/2/001013821.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/153228/3/001013821.pdf.jpg
bitstream.checksum.fl_str_mv 91007d2543f6820dc7c55f7cb353828c
6c7cae7d48c80e849154ecdb0884a290
9b7cd8a1fb137a482ba5db5d611b502b
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv lume@ufrgs.br||lume@ufrgs.br
_version_ 1810085395801571328