Predição de mapas de profundidades a partir de imagens monoculares por meio de redes neurais sem peso
Autor(a) principal: | |
---|---|
Data de Publicação: | 2010 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da Universidade Federal do Espírito Santo (riUfes) |
Texto Completo: | http://repositorio.ufes.br/handle/10/6398 |
Resumo: | Depth estimation – taking one or more images from a scene and estimating a depth map, which determines distances between the observer and points taken from various object surfaces – is a central problem in computer vision. It's not surprising, then, that the approach of stereo correspondence, traditionally applied to this problem, is one of the most intensively studied topics in the field. Stereo correspondence systems estimate depths from binocular features – more specifically, the difference between the positions of each point in a pair of images. Besides this purely geometrical information, images contains many monocular features – such as texture variations and gradients, focus, color patterns and reflection – which can be explored to derive depth estimates. For this, however, a certain amount of a priori knowledge must be gathered, since there is an inherent ambiguity between an image's characteristics and depth variations. Through his research on machine-learning systems based on Markov Random Fields (MRF's), Ashutosh Saxena proved that it is possible to estimate very accurate depth maps from a single monocular image. His approach, however, lacks biological plausibility, since there is no known theoretical correspondence between MRF's and the human brain's neural networks. Motivated by past successes in applying Weightless Neural Networks (WNN's) to computer vision problems, in this paper we investigate the effectiveness of applying WNN's to the problem of depth map estimation. With this, we hope to achieve performance improvements over Saxena's MRF-based approach, and develop a more useful architecture for evaluating hypotheses about visual information processing in the human cortex. |
id |
UFES_6ed84bf9abfe4218a9424165155d50e7 |
---|---|
oai_identifier_str |
oai:repositorio.ufes.br:10/6398 |
network_acronym_str |
UFES |
network_name_str |
Repositório Institucional da Universidade Federal do Espírito Santo (riUfes) |
repository_id_str |
2108 |
spelling |
Souza, Alberto Ferreira dePerroni Filho, HélioGonçalves, Claudine Santos BadueMeira Junior, Wagner2016-12-23T14:33:44Z2011-05-112016-12-23T14:33:44Z2010-02-27Depth estimation – taking one or more images from a scene and estimating a depth map, which determines distances between the observer and points taken from various object surfaces – is a central problem in computer vision. It's not surprising, then, that the approach of stereo correspondence, traditionally applied to this problem, is one of the most intensively studied topics in the field. Stereo correspondence systems estimate depths from binocular features – more specifically, the difference between the positions of each point in a pair of images. Besides this purely geometrical information, images contains many monocular features – such as texture variations and gradients, focus, color patterns and reflection – which can be explored to derive depth estimates. For this, however, a certain amount of a priori knowledge must be gathered, since there is an inherent ambiguity between an image's characteristics and depth variations. Through his research on machine-learning systems based on Markov Random Fields (MRF's), Ashutosh Saxena proved that it is possible to estimate very accurate depth maps from a single monocular image. His approach, however, lacks biological plausibility, since there is no known theoretical correspondence between MRF's and the human brain's neural networks. Motivated by past successes in applying Weightless Neural Networks (WNN's) to computer vision problems, in this paper we investigate the effectiveness of applying WNN's to the problem of depth map estimation. With this, we hope to achieve performance improvements over Saxena's MRF-based approach, and develop a more useful architecture for evaluating hypotheses about visual information processing in the human cortex.Um problema central para a Visão Computacional é o de depth estimation (“estimativa de profundidades”) – isto é, derivar, a partir de uma ou mais imagens de uma cena, um depth map (“mapa de profundidades”) que determine as distâncias entre o observador e cada ponto das várias superfícies capturadas. Não é surpresa, portanto, que a abordagem de stereo correspondence (“correspondência estéreo”), tradicionalmente usada nesse problema, seja um dos tópicos mais intensamente investigados do campo. Sistemas de correspondência estimam profundidades a partir de características binoculares do par estéreo – mais especificamente, a diferença entre as posições de cada ponto em um par de imagens. Além dessa informação puramente geométrica, imagens contêm uma série de características monoculares – tais como variações e gradientes de textura, variações de foco, padrões de cores e reflexão, etc. – que podem ser exploradas para derivar estimativas de profundidade. Para isso, entretanto, é preciso acumular certa quantidade de conhecimento a priori, uma vez que há uma ambiguidade intrínseca entre as características de uma imagem e variações de profundidade. Através de suas pesquisas com sistemas de aprendizado de máquina baseados em Markov Random Fields (MRF’s), Ashutosh Saxena demonstrou ser possível estimar mapas de profundidades com grande precisão a partir de imagens monoculares estáticas. Sua abordagem, entretanto, carece de plausibilidade biológica, visto que não há correspondência teórica conhecida entre MRF’s e as redes neurais do cérebro humano. Motivados por sucessos anteriores na aplicação de Weightless Neural Networks (“Redes Neurais Sem Peso" – RNSP's) a problemas de visão computacional, neste trabalho objetivamos investigar a efetividade da aplicação de RNSP’s ao problema de estimar mapas de profundidades. Com isso, esperamos alcançar uma melhoria em relação ao sistema baseado em MRF’s de Saxena, além de desenvolver uma arquitetura mais útil para a avaliação de hipóteses sobre o processamento de informações visuais no córtex humano.TextPERRONI FILHO, Hélio. Predição de mapas de profundidades a partir de imagens monoculares por meio de redes neurais sem peso. 2010. 54 f. Dissertação (Mestrado em Informática) - Universidade Federal do Espírito Santo, Centro Tecnológico, Vitória, 2010.http://repositorio.ufes.br/handle/10/6398porUniversidade Federal do Espírito SantoMestrado em InformáticaPrograma de Pós-Graduação em InformáticaUFESBRCentro TecnológicoVisão artificialRedes neurais (Computação)Aprendizado do computadorProfundidade - PercepçãoCiência da Computação004Predição de mapas de profundidades a partir de imagens monoculares por meio de redes neurais sem pesoinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da Universidade Federal do Espírito Santo (riUfes)instname:Universidade Federal do Espírito Santo (UFES)instacron:UFESORIGINALHelio Perroni Filho - Parte 1.pdfapplication/pdf3384577http://repositorio.ufes.br/bitstreams/32de4234-e824-4a87-b851-f0b3191a9931/download0d5b939b9a0aba325eeba2cd1c1dc632MD5110/63982024-07-17 17:01:44.484oai:repositorio.ufes.br:10/6398http://repositorio.ufes.brRepositório InstitucionalPUBhttp://repositorio.ufes.br/oai/requestopendoar:21082024-10-15T17:58:49.741759Repositório Institucional da Universidade Federal do Espírito Santo (riUfes) - Universidade Federal do Espírito Santo (UFES)false |
dc.title.none.fl_str_mv |
Predição de mapas de profundidades a partir de imagens monoculares por meio de redes neurais sem peso |
title |
Predição de mapas de profundidades a partir de imagens monoculares por meio de redes neurais sem peso |
spellingShingle |
Predição de mapas de profundidades a partir de imagens monoculares por meio de redes neurais sem peso Perroni Filho, Hélio Ciência da Computação Visão artificial Redes neurais (Computação) Aprendizado do computador Profundidade - Percepção 004 |
title_short |
Predição de mapas de profundidades a partir de imagens monoculares por meio de redes neurais sem peso |
title_full |
Predição de mapas de profundidades a partir de imagens monoculares por meio de redes neurais sem peso |
title_fullStr |
Predição de mapas de profundidades a partir de imagens monoculares por meio de redes neurais sem peso |
title_full_unstemmed |
Predição de mapas de profundidades a partir de imagens monoculares por meio de redes neurais sem peso |
title_sort |
Predição de mapas de profundidades a partir de imagens monoculares por meio de redes neurais sem peso |
author |
Perroni Filho, Hélio |
author_facet |
Perroni Filho, Hélio |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Souza, Alberto Ferreira de |
dc.contributor.author.fl_str_mv |
Perroni Filho, Hélio |
dc.contributor.referee1.fl_str_mv |
Gonçalves, Claudine Santos Badue |
dc.contributor.referee2.fl_str_mv |
Meira Junior, Wagner |
contributor_str_mv |
Souza, Alberto Ferreira de Gonçalves, Claudine Santos Badue Meira Junior, Wagner |
dc.subject.cnpq.fl_str_mv |
Ciência da Computação |
topic |
Ciência da Computação Visão artificial Redes neurais (Computação) Aprendizado do computador Profundidade - Percepção 004 |
dc.subject.br-rjbn.none.fl_str_mv |
Visão artificial Redes neurais (Computação) Aprendizado do computador Profundidade - Percepção |
dc.subject.udc.none.fl_str_mv |
004 |
description |
Depth estimation – taking one or more images from a scene and estimating a depth map, which determines distances between the observer and points taken from various object surfaces – is a central problem in computer vision. It's not surprising, then, that the approach of stereo correspondence, traditionally applied to this problem, is one of the most intensively studied topics in the field. Stereo correspondence systems estimate depths from binocular features – more specifically, the difference between the positions of each point in a pair of images. Besides this purely geometrical information, images contains many monocular features – such as texture variations and gradients, focus, color patterns and reflection – which can be explored to derive depth estimates. For this, however, a certain amount of a priori knowledge must be gathered, since there is an inherent ambiguity between an image's characteristics and depth variations. Through his research on machine-learning systems based on Markov Random Fields (MRF's), Ashutosh Saxena proved that it is possible to estimate very accurate depth maps from a single monocular image. His approach, however, lacks biological plausibility, since there is no known theoretical correspondence between MRF's and the human brain's neural networks. Motivated by past successes in applying Weightless Neural Networks (WNN's) to computer vision problems, in this paper we investigate the effectiveness of applying WNN's to the problem of depth map estimation. With this, we hope to achieve performance improvements over Saxena's MRF-based approach, and develop a more useful architecture for evaluating hypotheses about visual information processing in the human cortex. |
publishDate |
2010 |
dc.date.issued.fl_str_mv |
2010-02-27 |
dc.date.available.fl_str_mv |
2011-05-11 2016-12-23T14:33:44Z |
dc.date.accessioned.fl_str_mv |
2016-12-23T14:33:44Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
PERRONI FILHO, Hélio. Predição de mapas de profundidades a partir de imagens monoculares por meio de redes neurais sem peso. 2010. 54 f. Dissertação (Mestrado em Informática) - Universidade Federal do Espírito Santo, Centro Tecnológico, Vitória, 2010. |
dc.identifier.uri.fl_str_mv |
http://repositorio.ufes.br/handle/10/6398 |
identifier_str_mv |
PERRONI FILHO, Hélio. Predição de mapas de profundidades a partir de imagens monoculares por meio de redes neurais sem peso. 2010. 54 f. Dissertação (Mestrado em Informática) - Universidade Federal do Espírito Santo, Centro Tecnológico, Vitória, 2010. |
url |
http://repositorio.ufes.br/handle/10/6398 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
Text |
dc.publisher.none.fl_str_mv |
Universidade Federal do Espírito Santo Mestrado em Informática |
dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Informática |
dc.publisher.initials.fl_str_mv |
UFES |
dc.publisher.country.fl_str_mv |
BR |
dc.publisher.department.fl_str_mv |
Centro Tecnológico |
publisher.none.fl_str_mv |
Universidade Federal do Espírito Santo Mestrado em Informática |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da Universidade Federal do Espírito Santo (riUfes) instname:Universidade Federal do Espírito Santo (UFES) instacron:UFES |
instname_str |
Universidade Federal do Espírito Santo (UFES) |
instacron_str |
UFES |
institution |
UFES |
reponame_str |
Repositório Institucional da Universidade Federal do Espírito Santo (riUfes) |
collection |
Repositório Institucional da Universidade Federal do Espírito Santo (riUfes) |
bitstream.url.fl_str_mv |
http://repositorio.ufes.br/bitstreams/32de4234-e824-4a87-b851-f0b3191a9931/download |
bitstream.checksum.fl_str_mv |
0d5b939b9a0aba325eeba2cd1c1dc632 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 |
repository.name.fl_str_mv |
Repositório Institucional da Universidade Federal do Espírito Santo (riUfes) - Universidade Federal do Espírito Santo (UFES) |
repository.mail.fl_str_mv |
|
_version_ |
1813022552006590464 |