Leannet : uma arquitetura que utiliza o contexto da cena para melhorar o reconhecimento de objetos

Detalhes bibliográficos
Autor(a) principal: Silva, Leandro Pereira da
Data de Publicação: 2018
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da PUC_RS
Texto Completo: http://tede2.pucrs.br/tede2/handle/tede/8168
Resumo: Computer vision is the science that aims to give computers the capability of see- ing the world around them. Among its tasks, object recognition intends to classify objects and to identify where each object is in a given image. As objects tend to occur in particular environments, their contextual association can be useful to improve the object recognition task. To address the contextual awareness on object recognition task, the proposed ap- proach performs the identification of the scene context separately from the identification of the object, fusing both information in order to improve the object detection. In order to do so, we propose a novel architecture composed of two convolutional neural networks running in parallel: one for object identification and the other to the identification of the context where the object is located. Finally, the information of the two-streams architecture is concatenated to perform the object classification. The evaluation is performed using PASCAL VOC 2007 and MS COCO public datasets, by comparing the performance of our proposed approach with architectures that do not use the scene context to perform the classification of the ob- jects. Results show that our approach is able to raise in-context object scores, and reduces out-of-context objects scores.
id P_RS_6746665875d7148960754b0b54e9e14e
oai_identifier_str oai:tede2.pucrs.br:tede/8168
network_acronym_str P_RS
network_name_str Biblioteca Digital de Teses e Dissertações da PUC_RS
repository_id_str
spelling Ruiz, Duncan Dubugras Alcobahttp://lattes.cnpq.br/8250832800932125http://lattes.cnpq.br/0541028414171477Silva, Leandro Pereira da2018-06-26T13:34:22Z2018-03-27http://tede2.pucrs.br/tede2/handle/tede/8168Computer vision is the science that aims to give computers the capability of see- ing the world around them. Among its tasks, object recognition intends to classify objects and to identify where each object is in a given image. As objects tend to occur in particular environments, their contextual association can be useful to improve the object recognition task. To address the contextual awareness on object recognition task, the proposed ap- proach performs the identification of the scene context separately from the identification of the object, fusing both information in order to improve the object detection. In order to do so, we propose a novel architecture composed of two convolutional neural networks running in parallel: one for object identification and the other to the identification of the context where the object is located. Finally, the information of the two-streams architecture is concatenated to perform the object classification. The evaluation is performed using PASCAL VOC 2007 and MS COCO public datasets, by comparing the performance of our proposed approach with architectures that do not use the scene context to perform the classification of the ob- jects. Results show that our approach is able to raise in-context object scores, and reduces out-of-context objects scores.A visão computacional é a ciência que permite fornecer aos computadores a ca- pacidade de verem o mundo em sua volta. Entre as tarefas, o reconhecimento de objetos pretende classificar objetos e identificar a posição onde cada objeto está em uma imagem. Como objetos costumam ocorrer em ambientes particulares, a utilização de seus contex- tos pode ser vantajosa para melhorar a tarefa de reconhecimento de objetos. Para utilizar o contexto na tarefa de reconhecimento de objetos, a abordagem proposta realiza a iden- tificação do contexto da cena separadamente da identificação do objeto, fundindo ambas informações para a melhora da detecção do objeto. Para tanto, propomos uma nova arquite- tura composta de duas redes neurais convolucionais em paralelo: uma para a identificação do objeto e outra para a identificação do contexto no qual o objeto está inserido. Por fim, a informação de ambas as redes é concatenada para realizar a classificação do objeto. Ava- liamos a arquitetura proposta com os datasets públicos PASCAL VOC 2007 e o MS COCO, comparando o desempenho da abordagem proposta com abordagens que não utilizam o contexto. Os resultados mostram que nossa abordagem é capaz de aumentar a probabili- dade de classificação para objetos que estão em contexto e reduzir para objetos que estão fora de contexto.Submitted by PPG Ciência da Computação (ppgcc@pucrs.br) on 2018-06-15T16:40:47Z No. of bitstreams: 1 LEANDRO PEREIRA DA SILVA_DIS.pdf: 16008947 bytes, checksum: 327a925ea56fcca0a86530a0eb3b1637 (MD5)Approved for entry into archive by Sheila Dias (sheila.dias@pucrs.br) on 2018-06-26T13:25:28Z (GMT) No. of bitstreams: 1 LEANDRO PEREIRA DA SILVA_DIS.pdf: 16008947 bytes, checksum: 327a925ea56fcca0a86530a0eb3b1637 (MD5)Made available in DSpace on 2018-06-26T13:34:22Z (GMT). No. of bitstreams: 1 LEANDRO PEREIRA DA SILVA_DIS.pdf: 16008947 bytes, checksum: 327a925ea56fcca0a86530a0eb3b1637 (MD5) Previous issue date: 2018-03-27application/pdfhttp://tede2.pucrs.br:80/tede2/retrieve/172628/DIS_LEANDRO_PEREIRA_DA_SILVA_COMPLETO.pdf.jpgporPontifícia Universidade Católica do Rio Grande do SulPrograma de Pós-Graduação em Ciência da ComputaçãoPUCRSBrasilEscola PolitécnicaDetecção de ObjetosRede Neural ConvolucionalRede NeuralAprendizagem ProfundaObjetos em ContextoObject DetectionConvolutional Neural NetworkNeural NetworkDeep LearningObject in ContextCIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAOLeannet : uma arquitetura que utiliza o contexto da cena para melhorar o reconhecimento de objetosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisTrabalho não apresenta restrição para publicação1974996533081274470500500-862078257083325301info:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da PUC_RSinstname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)instacron:PUC_RSTHUMBNAILDIS_LEANDRO_PEREIRA_DA_SILVA_COMPLETO.pdf.jpgDIS_LEANDRO_PEREIRA_DA_SILVA_COMPLETO.pdf.jpgimage/jpeg5598http://tede2.pucrs.br/tede2/bitstream/tede/8168/4/DIS_LEANDRO_PEREIRA_DA_SILVA_COMPLETO.pdf.jpg4ee3cf0d65ad490630c84438b61b58ccMD54TEXTDIS_LEANDRO_PEREIRA_DA_SILVA_COMPLETO.pdf.txtDIS_LEANDRO_PEREIRA_DA_SILVA_COMPLETO.pdf.txttext/plain125491http://tede2.pucrs.br/tede2/bitstream/tede/8168/3/DIS_LEANDRO_PEREIRA_DA_SILVA_COMPLETO.pdf.txta2d1414c8a799297b055d89ea3b20fe3MD53ORIGINALDIS_LEANDRO_PEREIRA_DA_SILVA_COMPLETO.pdfDIS_LEANDRO_PEREIRA_DA_SILVA_COMPLETO.pdfapplication/pdf1745852http://tede2.pucrs.br/tede2/bitstream/tede/8168/2/DIS_LEANDRO_PEREIRA_DA_SILVA_COMPLETO.pdf33ba4f9e01bfe933b903189daa72bfc1MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-8610http://tede2.pucrs.br/tede2/bitstream/tede/8168/1/license.txt5a9d6006225b368ef605ba16b4f6d1beMD51tede/81682018-06-26 20:00:58.215oai:tede2.pucrs.br:tede/8168QXV0b3JpemHDp8OjbyBwYXJhIFB1YmxpY2HDp8OjbyBFbGV0csO0bmljYTogQ29tIGJhc2Ugbm8gZGlzcG9zdG8gbmEgTGVpIEZlZGVyYWwgbsK6OS42MTAsIGRlIDE5IGRlIGZldmVyZWlybyBkZSAxOTk4LCBvIGF1dG9yIEFVVE9SSVpBIGEgcHVibGljYcOnw6NvIGVsZXRyw7RuaWNhIGRhIHByZXNlbnRlIG9icmEgbm8gYWNlcnZvIGRhIEJpYmxpb3RlY2EgRGlnaXRhbCBkYSBQb250aWbDrWNpYSBVbml2ZXJzaWRhZGUgQ2F0w7NsaWNhIGRvIFJpbyBHcmFuZGUgZG8gU3VsLCBzZWRpYWRhIGEgQXYuIElwaXJhbmdhIDY2ODEsIFBvcnRvIEFsZWdyZSwgUmlvIEdyYW5kZSBkbyBTdWwsIGNvbSByZWdpc3RybyBkZSBDTlBKIDg4NjMwNDEzMDAwMi04MSBiZW0gY29tbyBlbSBvdXRyYXMgYmlibGlvdGVjYXMgZGlnaXRhaXMsIG5hY2lvbmFpcyBlIGludGVybmFjaW9uYWlzLCBjb25zw7NyY2lvcyBlIHJlZGVzIMOgcyBxdWFpcyBhIGJpYmxpb3RlY2EgZGEgUFVDUlMgcG9zc2EgYSB2aXIgcGFydGljaXBhciwgc2VtIMO0bnVzIGFsdXNpdm8gYW9zIGRpcmVpdG9zIGF1dG9yYWlzLCBhIHTDrXR1bG8gZGUgZGl2dWxnYcOnw6NvIGRhIHByb2R1w6fDo28gY2llbnTDrWZpY2EuCg==Biblioteca Digital de Teses e Dissertaçõeshttp://tede2.pucrs.br/tede2/PRIhttps://tede2.pucrs.br/oai/requestbiblioteca.central@pucrs.br||opendoar:2018-06-26T23:00:58Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)false
dc.title.por.fl_str_mv Leannet : uma arquitetura que utiliza o contexto da cena para melhorar o reconhecimento de objetos
title Leannet : uma arquitetura que utiliza o contexto da cena para melhorar o reconhecimento de objetos
spellingShingle Leannet : uma arquitetura que utiliza o contexto da cena para melhorar o reconhecimento de objetos
Silva, Leandro Pereira da
Detecção de Objetos
Rede Neural Convolucional
Rede Neural
Aprendizagem Profunda
Objetos em Contexto
Object Detection
Convolutional Neural Network
Neural Network
Deep Learning
Object in Context
CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO
title_short Leannet : uma arquitetura que utiliza o contexto da cena para melhorar o reconhecimento de objetos
title_full Leannet : uma arquitetura que utiliza o contexto da cena para melhorar o reconhecimento de objetos
title_fullStr Leannet : uma arquitetura que utiliza o contexto da cena para melhorar o reconhecimento de objetos
title_full_unstemmed Leannet : uma arquitetura que utiliza o contexto da cena para melhorar o reconhecimento de objetos
title_sort Leannet : uma arquitetura que utiliza o contexto da cena para melhorar o reconhecimento de objetos
author Silva, Leandro Pereira da
author_facet Silva, Leandro Pereira da
author_role author
dc.contributor.advisor1.fl_str_mv Ruiz, Duncan Dubugras Alcoba
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/8250832800932125
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/0541028414171477
dc.contributor.author.fl_str_mv Silva, Leandro Pereira da
contributor_str_mv Ruiz, Duncan Dubugras Alcoba
dc.subject.por.fl_str_mv Detecção de Objetos
Rede Neural Convolucional
Rede Neural
Aprendizagem Profunda
Objetos em Contexto
topic Detecção de Objetos
Rede Neural Convolucional
Rede Neural
Aprendizagem Profunda
Objetos em Contexto
Object Detection
Convolutional Neural Network
Neural Network
Deep Learning
Object in Context
CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO
dc.subject.eng.fl_str_mv Object Detection
Convolutional Neural Network
Neural Network
Deep Learning
Object in Context
dc.subject.cnpq.fl_str_mv CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO
description Computer vision is the science that aims to give computers the capability of see- ing the world around them. Among its tasks, object recognition intends to classify objects and to identify where each object is in a given image. As objects tend to occur in particular environments, their contextual association can be useful to improve the object recognition task. To address the contextual awareness on object recognition task, the proposed ap- proach performs the identification of the scene context separately from the identification of the object, fusing both information in order to improve the object detection. In order to do so, we propose a novel architecture composed of two convolutional neural networks running in parallel: one for object identification and the other to the identification of the context where the object is located. Finally, the information of the two-streams architecture is concatenated to perform the object classification. The evaluation is performed using PASCAL VOC 2007 and MS COCO public datasets, by comparing the performance of our proposed approach with architectures that do not use the scene context to perform the classification of the ob- jects. Results show that our approach is able to raise in-context object scores, and reduces out-of-context objects scores.
publishDate 2018
dc.date.accessioned.fl_str_mv 2018-06-26T13:34:22Z
dc.date.issued.fl_str_mv 2018-03-27
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://tede2.pucrs.br/tede2/handle/tede/8168
url http://tede2.pucrs.br/tede2/handle/tede/8168
dc.language.iso.fl_str_mv por
language por
dc.relation.program.fl_str_mv 1974996533081274470
dc.relation.confidence.fl_str_mv 500
500
dc.relation.cnpq.fl_str_mv -862078257083325301
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Pontifícia Universidade Católica do Rio Grande do Sul
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Ciência da Computação
dc.publisher.initials.fl_str_mv PUCRS
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Escola Politécnica
publisher.none.fl_str_mv Pontifícia Universidade Católica do Rio Grande do Sul
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da PUC_RS
instname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
instacron:PUC_RS
instname_str Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
instacron_str PUC_RS
institution PUC_RS
reponame_str Biblioteca Digital de Teses e Dissertações da PUC_RS
collection Biblioteca Digital de Teses e Dissertações da PUC_RS
bitstream.url.fl_str_mv http://tede2.pucrs.br/tede2/bitstream/tede/8168/4/DIS_LEANDRO_PEREIRA_DA_SILVA_COMPLETO.pdf.jpg
http://tede2.pucrs.br/tede2/bitstream/tede/8168/3/DIS_LEANDRO_PEREIRA_DA_SILVA_COMPLETO.pdf.txt
http://tede2.pucrs.br/tede2/bitstream/tede/8168/2/DIS_LEANDRO_PEREIRA_DA_SILVA_COMPLETO.pdf
http://tede2.pucrs.br/tede2/bitstream/tede/8168/1/license.txt
bitstream.checksum.fl_str_mv 4ee3cf0d65ad490630c84438b61b58cc
a2d1414c8a799297b055d89ea3b20fe3
33ba4f9e01bfe933b903189daa72bfc1
5a9d6006225b368ef605ba16b4f6d1be
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
repository.mail.fl_str_mv biblioteca.central@pucrs.br||
_version_ 1799765334665723904