Visão computacional : indexação automatizada de imagens
Autor(a) principal: | |
---|---|
Data de Publicação: | 2004 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da UFRGS |
Texto Completo: | http://hdl.handle.net/10183/153228 |
Resumo: | O avanço tecnológico atual está permitindo que as pessoas recebam cada vez mais informações visuais dos mais diferentes tipos, nas mais variadas mídias. Esse aumento fantástico está obrigando os pesquisadores e as indústrias a imaginar soluções para o armazenamento e recuperação deste tipo de informação, pois nossos computadores ainda utilizam, apesar dos grandes avanços nessa área, um sistema de arquivos imaginado há décadas, quando era natural trabalhar com informações meramente textuais. Agora, nos deparamos com novos problemas: Como encontrar uma paisagem específica em um banco de imagens, em que trecho de um filme aparece um cavalo sobre uma colina, em que parte da fotografia existe um gato, como fazer um robô localizar um objeto em uma cena, entre outras necessidades. O objetivo desse trabalho é propor uma arquitetura de rede neural artificial que permita o reconhecimento de objetos genéricos e de categorias em banco de imagens digitais, de forma que se possa recuperar imagens específicas a partir da descrição da cena fornecida pelo usuário. Para que esse objetivo fosse alcançado, foram utilizadas técnicas de Visão Computacional e Processamento de Imagens na etapa de extração de feições de baixo nível e de Redes Neurais(Mapas Auto-Organizáveis de Kohonen) na etapa de agrupamento de classes de objetos. O resultado final desse trabalho pretende ser um embrião para um sistema de reconhecimento de objetos mais genérico, que possa ser estendido para a criação de indices de forma automática ou semi-automática em grandes bancos de imagens. |
id |
URGS_e2733f159ef26b56ee137e2330a6b726 |
---|---|
oai_identifier_str |
oai:www.lume.ufrgs.br:10183/153228 |
network_acronym_str |
URGS |
network_name_str |
Biblioteca Digital de Teses e Dissertações da UFRGS |
repository_id_str |
1853 |
spelling |
Ferrugem, Anderson PriebeBarone, Dante Augusto Couto2017-03-16T02:20:17Z2004http://hdl.handle.net/10183/153228001013821O avanço tecnológico atual está permitindo que as pessoas recebam cada vez mais informações visuais dos mais diferentes tipos, nas mais variadas mídias. Esse aumento fantástico está obrigando os pesquisadores e as indústrias a imaginar soluções para o armazenamento e recuperação deste tipo de informação, pois nossos computadores ainda utilizam, apesar dos grandes avanços nessa área, um sistema de arquivos imaginado há décadas, quando era natural trabalhar com informações meramente textuais. Agora, nos deparamos com novos problemas: Como encontrar uma paisagem específica em um banco de imagens, em que trecho de um filme aparece um cavalo sobre uma colina, em que parte da fotografia existe um gato, como fazer um robô localizar um objeto em uma cena, entre outras necessidades. O objetivo desse trabalho é propor uma arquitetura de rede neural artificial que permita o reconhecimento de objetos genéricos e de categorias em banco de imagens digitais, de forma que se possa recuperar imagens específicas a partir da descrição da cena fornecida pelo usuário. Para que esse objetivo fosse alcançado, foram utilizadas técnicas de Visão Computacional e Processamento de Imagens na etapa de extração de feições de baixo nível e de Redes Neurais(Mapas Auto-Organizáveis de Kohonen) na etapa de agrupamento de classes de objetos. O resultado final desse trabalho pretende ser um embrião para um sistema de reconhecimento de objetos mais genérico, que possa ser estendido para a criação de indices de forma automática ou semi-automática em grandes bancos de imagens.The current technological progress allows people to receive more and more visual information of the most different types, in different medias. This huge augmentation of image availability forces researchers and industries to propose efficient solutions for image storage and recovery. Despite the extraordinary advances in computational power, the data files system remain the same for decades, when it was natural to deal only with textual information. Nowadays, new problems are in front of us in this field. For instance, how can we find an specific landscape in a image database, in which place of a movie there is a horse on a hill, in which part of a photographic picture there is a cat, how can a robot find an object in a scene, among other queries. The objective of this work is to propose an Artificial Neural Network (ANN) architecture that performs the recognition of generic objects and object’s categories in a digital image database. With this implementation, it becomes possible to do image retrieval through the user´s scene description. To achieve our goal, we have used Computer Vision and Image Processing techniques in low level features extraction and Neural Networks (namely Kohonen’s Self-Organizing Maps) in the phase of object classes clustering. The main result of this work aims to be a seed for a more generic object recognition system, which can be extended to the automatic or semi-automatic index creation in huge image databases.application/pdfporComputação gráficaVisão computacionalProcessamento de imagensImage retrievalComputer visionSelf-Organizing mapsSOMVisão computacional : indexação automatizada de imagensComputer vision : automated indexing of imagesinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPrograma de Pós-Graduação em ComputaçãoPorto Alegre, BR-RS2004mestradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSORIGINAL001013821.pdf001013821.pdfTexto completoapplication/pdf1063408http://www.lume.ufrgs.br/bitstream/10183/153228/1/001013821.pdf91007d2543f6820dc7c55f7cb353828cMD51TEXT001013821.pdf.txt001013821.pdf.txtExtracted Texttext/plain174761http://www.lume.ufrgs.br/bitstream/10183/153228/2/001013821.pdf.txt6c7cae7d48c80e849154ecdb0884a290MD52THUMBNAIL001013821.pdf.jpg001013821.pdf.jpgGenerated Thumbnailimage/jpeg1030http://www.lume.ufrgs.br/bitstream/10183/153228/3/001013821.pdf.jpg9b7cd8a1fb137a482ba5db5d611b502bMD5310183/1532282022-02-22 04:48:31.178419oai:www.lume.ufrgs.br:10183/153228Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532022-02-22T07:48:31Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false |
dc.title.pt_BR.fl_str_mv |
Visão computacional : indexação automatizada de imagens |
dc.title.alternative.en.fl_str_mv |
Computer vision : automated indexing of images |
title |
Visão computacional : indexação automatizada de imagens |
spellingShingle |
Visão computacional : indexação automatizada de imagens Ferrugem, Anderson Priebe Computação gráfica Visão computacional Processamento de imagens Image retrieval Computer vision Self-Organizing maps SOM |
title_short |
Visão computacional : indexação automatizada de imagens |
title_full |
Visão computacional : indexação automatizada de imagens |
title_fullStr |
Visão computacional : indexação automatizada de imagens |
title_full_unstemmed |
Visão computacional : indexação automatizada de imagens |
title_sort |
Visão computacional : indexação automatizada de imagens |
author |
Ferrugem, Anderson Priebe |
author_facet |
Ferrugem, Anderson Priebe |
author_role |
author |
dc.contributor.author.fl_str_mv |
Ferrugem, Anderson Priebe |
dc.contributor.advisor1.fl_str_mv |
Barone, Dante Augusto Couto |
contributor_str_mv |
Barone, Dante Augusto Couto |
dc.subject.por.fl_str_mv |
Computação gráfica Visão computacional Processamento de imagens |
topic |
Computação gráfica Visão computacional Processamento de imagens Image retrieval Computer vision Self-Organizing maps SOM |
dc.subject.eng.fl_str_mv |
Image retrieval Computer vision Self-Organizing maps SOM |
description |
O avanço tecnológico atual está permitindo que as pessoas recebam cada vez mais informações visuais dos mais diferentes tipos, nas mais variadas mídias. Esse aumento fantástico está obrigando os pesquisadores e as indústrias a imaginar soluções para o armazenamento e recuperação deste tipo de informação, pois nossos computadores ainda utilizam, apesar dos grandes avanços nessa área, um sistema de arquivos imaginado há décadas, quando era natural trabalhar com informações meramente textuais. Agora, nos deparamos com novos problemas: Como encontrar uma paisagem específica em um banco de imagens, em que trecho de um filme aparece um cavalo sobre uma colina, em que parte da fotografia existe um gato, como fazer um robô localizar um objeto em uma cena, entre outras necessidades. O objetivo desse trabalho é propor uma arquitetura de rede neural artificial que permita o reconhecimento de objetos genéricos e de categorias em banco de imagens digitais, de forma que se possa recuperar imagens específicas a partir da descrição da cena fornecida pelo usuário. Para que esse objetivo fosse alcançado, foram utilizadas técnicas de Visão Computacional e Processamento de Imagens na etapa de extração de feições de baixo nível e de Redes Neurais(Mapas Auto-Organizáveis de Kohonen) na etapa de agrupamento de classes de objetos. O resultado final desse trabalho pretende ser um embrião para um sistema de reconhecimento de objetos mais genérico, que possa ser estendido para a criação de indices de forma automática ou semi-automática em grandes bancos de imagens. |
publishDate |
2004 |
dc.date.issued.fl_str_mv |
2004 |
dc.date.accessioned.fl_str_mv |
2017-03-16T02:20:17Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10183/153228 |
dc.identifier.nrb.pt_BR.fl_str_mv |
001013821 |
url |
http://hdl.handle.net/10183/153228 |
identifier_str_mv |
001013821 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UFRGS instname:Universidade Federal do Rio Grande do Sul (UFRGS) instacron:UFRGS |
instname_str |
Universidade Federal do Rio Grande do Sul (UFRGS) |
instacron_str |
UFRGS |
institution |
UFRGS |
reponame_str |
Biblioteca Digital de Teses e Dissertações da UFRGS |
collection |
Biblioteca Digital de Teses e Dissertações da UFRGS |
bitstream.url.fl_str_mv |
http://www.lume.ufrgs.br/bitstream/10183/153228/1/001013821.pdf http://www.lume.ufrgs.br/bitstream/10183/153228/2/001013821.pdf.txt http://www.lume.ufrgs.br/bitstream/10183/153228/3/001013821.pdf.jpg |
bitstream.checksum.fl_str_mv |
91007d2543f6820dc7c55f7cb353828c 6c7cae7d48c80e849154ecdb0884a290 9b7cd8a1fb137a482ba5db5d611b502b |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS) |
repository.mail.fl_str_mv |
lume@ufrgs.br||lume@ufrgs.br |
_version_ |
1810085395801571328 |