Re-Identificação de pessoas em imagens digitais utilizando redes neurais siamesas e triplet baseadas em uma rede neural convolucional e um autoencoder

Detalhes bibliográficos
Autor(a) principal: Enembreck, Fábia Isabella Pires
Data de Publicação: 2020
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
Texto Completo: http://repositorio.utfpr.edu.br/jspui/handle/1/5231
Resumo: Em ambientes monitorados por câmeras de segurança, o problema de determinar se uma pessoa que está sendo observada já esteve presente na cena ou não, independente se o sistema utiliza uma ou mais câmeras, é chamado de re-identificação de pessoas. Este problema é considerado desafiador, uma vez que as imagens obtidas por câmeras estão sujeitas a sofrer grandes variações, como iluminação e perspectiva. Além disso, pessoas em imagens podem passar por transformações e oclusões parciais. Com isso, este trabalho tem como objetivo o desenvolvimento de duas abordagens para re-identificação de pessoas que sejam robustas a essas variações, por meio de técnicas de aprendizagem profunda. A primeira abordagem proposta utiliza uma arquitetura de rede neural siamesa, composta por duas sub-redes idênticas, esse modelo recebe duas imagens de entrada que podem ser ou não de uma mesma pessoa. A segunda abordagem consiste em uma rede neural triplet, com três sub-redes idênticas e que recebe de entrada uma imagem de referência de uma determinada pessoa, uma segunda imagem da mesma pessoa e outra imagem de uma pessoa diferente. Ambas as redes possuem sub-redes idênticas, formadas por uma rede neural convolucional que irá extrair características gerais de cada imagem e uma rede autoencoder, responsável por tratar as grandes variações que as imagens da entrada podem sofrer. Para analisar e comparar as redes desenvolvidas foram utilizados três datasets, sendo que as medidas de avaliação escolhidas para análise foram a acurácia e a curva CMC. Experimentos realizados comprovaram uma melhora de até 71,05% nos resultados com a utilização do autoencoder nas sub-redes. Além disso, os experimentos também mostraram uma superioridade da rede neural triplet desenvolvida neste trabalho em relação a rede neural siamesa e a outros métodos do estado da arte.
id UTFPR-12_3bd793f4533dbf2d49c32d9ad912e6e9
oai_identifier_str oai:repositorio.utfpr.edu.br:1/5231
network_acronym_str UTFPR-12
network_name_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
repository_id_str
spelling 2020-10-15T16:53:45Z2020-10-15T16:53:45Z2020-08-18ENEMBRECK, Fábia Isabella Pires. Re-Identificação de pessoas em imagens digitais utilizando redes neurais siamesas e triplet baseadas em uma rede neural convolucional e um autoencoder. 2020. Dissertação (Mestrado em Ciência da Computação) - Universidade Tecnológica Federal do Paraná, Ponta Grossa, 2020.http://repositorio.utfpr.edu.br/jspui/handle/1/5231Em ambientes monitorados por câmeras de segurança, o problema de determinar se uma pessoa que está sendo observada já esteve presente na cena ou não, independente se o sistema utiliza uma ou mais câmeras, é chamado de re-identificação de pessoas. Este problema é considerado desafiador, uma vez que as imagens obtidas por câmeras estão sujeitas a sofrer grandes variações, como iluminação e perspectiva. Além disso, pessoas em imagens podem passar por transformações e oclusões parciais. Com isso, este trabalho tem como objetivo o desenvolvimento de duas abordagens para re-identificação de pessoas que sejam robustas a essas variações, por meio de técnicas de aprendizagem profunda. A primeira abordagem proposta utiliza uma arquitetura de rede neural siamesa, composta por duas sub-redes idênticas, esse modelo recebe duas imagens de entrada que podem ser ou não de uma mesma pessoa. A segunda abordagem consiste em uma rede neural triplet, com três sub-redes idênticas e que recebe de entrada uma imagem de referência de uma determinada pessoa, uma segunda imagem da mesma pessoa e outra imagem de uma pessoa diferente. Ambas as redes possuem sub-redes idênticas, formadas por uma rede neural convolucional que irá extrair características gerais de cada imagem e uma rede autoencoder, responsável por tratar as grandes variações que as imagens da entrada podem sofrer. Para analisar e comparar as redes desenvolvidas foram utilizados três datasets, sendo que as medidas de avaliação escolhidas para análise foram a acurácia e a curva CMC. Experimentos realizados comprovaram uma melhora de até 71,05% nos resultados com a utilização do autoencoder nas sub-redes. Além disso, os experimentos também mostraram uma superioridade da rede neural triplet desenvolvida neste trabalho em relação a rede neural siamesa e a outros métodos do estado da arte.In environments monitored by security cameras, the problem of identifying if a person being watched has ever been in the scene or not, independent of the system uses one or more cameras, is called person re-identification. This problem is considered challenging, since the images obtained by cameras are subject to many variations, such as lighting and perspective. In addition, people in pictures may undergo transformations and partial occlusions. This work aims to develop two approaches for person re-identification robust to these variations, through deep learning techniques. The first approach proposed uses a Siamese neural network architecture, composed of two identical subnets, this model receives two input images that may or may not be from the same person. The second approach consists of a triplet neural network, with three identical subnets, which receives a reference image from a certain person, a second image from the same person and another image from a different person. Both networks have identical subnets, formed by a convolutional neural network that will extract general characteristics from each image and an autoencoder network, responsible for dealing with the great variations that the input images may undergo. To analyze and compare the developed networks, three datasets were used, and the metrics chosen for analysis were accuracy and the CMC curve. Experiments carried out proved an improvement up to 71.05% in the results with the use of the autoencoder in the subnets. Also, the experiments showed a superiority of the triplet neural network developed in this work to the siamese neural network and other state-of-the-art methods.Universidade Tecnológica Federal do Paraná (UTFPR)porUniversidade Tecnológica Federal do ParanáPonta GrossaPrograma de Pós-Graduação em Ciência da ComputaçãoUTFPRBrasilCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOEngenharia/Tecnologia/GestãoPessoas - IdentificaçãoVigilância eletrônicaImagens digitaisRedes neurais (Computação)Persons - IdentificationElectronic surveillanceDigital imagesNeural networks (Computer science)Re-Identificação de pessoas em imagens digitais utilizando redes neurais siamesas e triplet baseadas em uma rede neural convolucional e um autoencoderPerson re-identification in digital images using siamese and triplet neural networks based on a convolutional neural network and an autoencoderinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisPonta GrossaMorais, Erikson Freitas dehttps://orcid.org/0000-0002-0845-7457http://lattes.cnpq.br/1716165820460791Morais, Erikson Freitas dehttps://orcid.org/0000-0002-0845-7457http://lattes.cnpq.br/1716165820460791Senger, Luciano Joséhttps://orcid.org/0000-0001-6633-006Xhttp://lattes.cnpq.br/6880696447532558Martins, Marcella Scoczynski Ribeirohttps://orcid.org/0000-0002-5716-4968http://lattes.cnpq.br/5212122361603572Schwartz, William Robsonhttps://orcid.org/0000-0003-1449-8834http://lattes.cnpq.br/0704592200063682https://orcid.org/0000-0001-7364-0912http://lattes.cnpq.br/4822479229399141Enembreck, Fábia Isabella Piresinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))instname:Universidade Tecnológica Federal do Paraná (UTFPR)instacron:UTFPRORIGINALreidentificacaopessoasimagensdigitais.pdfapplication/pdf3185459http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/5231/1/reidentificacaopessoasimagensdigitais.pdf49b053104bc58b6a7bb08bc053197521MD51TEXTreidentificacaopessoasimagensdigitais.pdf.txtreidentificacaopessoasimagensdigitais.pdf.txtExtracted texttext/plain153089http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/5231/2/reidentificacaopessoasimagensdigitais.pdf.txtd63d50dfd2f9b8260d7a450ee9b8f26eMD52THUMBNAILreidentificacaopessoasimagensdigitais.pdf.jpgreidentificacaopessoasimagensdigitais.pdf.jpgGenerated Thumbnailimage/jpeg1325http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/5231/3/reidentificacaopessoasimagensdigitais.pdf.jpg294cf9cc12883525f511b0715c34e65dMD531/52312020-10-16 03:01:10.857oai:repositorio.utfpr.edu.br:1/5231Repositório de PublicaçõesPUBhttp://repositorio.utfpr.edu.br:8080/oai/requestopendoar:2020-10-16T06:01:10Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)false
dc.title.pt_BR.fl_str_mv Re-Identificação de pessoas em imagens digitais utilizando redes neurais siamesas e triplet baseadas em uma rede neural convolucional e um autoencoder
dc.title.alternative.pt_BR.fl_str_mv Person re-identification in digital images using siamese and triplet neural networks based on a convolutional neural network and an autoencoder
title Re-Identificação de pessoas em imagens digitais utilizando redes neurais siamesas e triplet baseadas em uma rede neural convolucional e um autoencoder
spellingShingle Re-Identificação de pessoas em imagens digitais utilizando redes neurais siamesas e triplet baseadas em uma rede neural convolucional e um autoencoder
Enembreck, Fábia Isabella Pires
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Pessoas - Identificação
Vigilância eletrônica
Imagens digitais
Redes neurais (Computação)
Persons - Identification
Electronic surveillance
Digital images
Neural networks (Computer science)
Engenharia/Tecnologia/Gestão
title_short Re-Identificação de pessoas em imagens digitais utilizando redes neurais siamesas e triplet baseadas em uma rede neural convolucional e um autoencoder
title_full Re-Identificação de pessoas em imagens digitais utilizando redes neurais siamesas e triplet baseadas em uma rede neural convolucional e um autoencoder
title_fullStr Re-Identificação de pessoas em imagens digitais utilizando redes neurais siamesas e triplet baseadas em uma rede neural convolucional e um autoencoder
title_full_unstemmed Re-Identificação de pessoas em imagens digitais utilizando redes neurais siamesas e triplet baseadas em uma rede neural convolucional e um autoencoder
title_sort Re-Identificação de pessoas em imagens digitais utilizando redes neurais siamesas e triplet baseadas em uma rede neural convolucional e um autoencoder
author Enembreck, Fábia Isabella Pires
author_facet Enembreck, Fábia Isabella Pires
author_role author
dc.contributor.advisor1.fl_str_mv Morais, Erikson Freitas de
dc.contributor.advisor1ID.fl_str_mv https://orcid.org/0000-0002-0845-7457
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/1716165820460791
dc.contributor.referee1.fl_str_mv Morais, Erikson Freitas de
dc.contributor.referee1ID.fl_str_mv https://orcid.org/0000-0002-0845-7457
dc.contributor.referee1Lattes.fl_str_mv http://lattes.cnpq.br/1716165820460791
dc.contributor.referee2.fl_str_mv Senger, Luciano José
dc.contributor.referee2ID.fl_str_mv https://orcid.org/0000-0001-6633-006X
dc.contributor.referee2Lattes.fl_str_mv http://lattes.cnpq.br/6880696447532558
dc.contributor.referee3.fl_str_mv Martins, Marcella Scoczynski Ribeiro
dc.contributor.referee3ID.fl_str_mv https://orcid.org/0000-0002-5716-4968
dc.contributor.referee3Lattes.fl_str_mv http://lattes.cnpq.br/5212122361603572
dc.contributor.referee4.fl_str_mv Schwartz, William Robson
dc.contributor.referee4ID.fl_str_mv https://orcid.org/0000-0003-1449-8834
dc.contributor.referee4Lattes.fl_str_mv http://lattes.cnpq.br/0704592200063682
dc.contributor.authorID.fl_str_mv https://orcid.org/0000-0001-7364-0912
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/4822479229399141
dc.contributor.author.fl_str_mv Enembreck, Fábia Isabella Pires
contributor_str_mv Morais, Erikson Freitas de
Morais, Erikson Freitas de
Senger, Luciano José
Martins, Marcella Scoczynski Ribeiro
Schwartz, William Robson
dc.subject.cnpq.fl_str_mv CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
topic CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Pessoas - Identificação
Vigilância eletrônica
Imagens digitais
Redes neurais (Computação)
Persons - Identification
Electronic surveillance
Digital images
Neural networks (Computer science)
Engenharia/Tecnologia/Gestão
dc.subject.por.fl_str_mv Pessoas - Identificação
Vigilância eletrônica
Imagens digitais
Redes neurais (Computação)
Persons - Identification
Electronic surveillance
Digital images
Neural networks (Computer science)
dc.subject.capes.pt_BR.fl_str_mv Engenharia/Tecnologia/Gestão
description Em ambientes monitorados por câmeras de segurança, o problema de determinar se uma pessoa que está sendo observada já esteve presente na cena ou não, independente se o sistema utiliza uma ou mais câmeras, é chamado de re-identificação de pessoas. Este problema é considerado desafiador, uma vez que as imagens obtidas por câmeras estão sujeitas a sofrer grandes variações, como iluminação e perspectiva. Além disso, pessoas em imagens podem passar por transformações e oclusões parciais. Com isso, este trabalho tem como objetivo o desenvolvimento de duas abordagens para re-identificação de pessoas que sejam robustas a essas variações, por meio de técnicas de aprendizagem profunda. A primeira abordagem proposta utiliza uma arquitetura de rede neural siamesa, composta por duas sub-redes idênticas, esse modelo recebe duas imagens de entrada que podem ser ou não de uma mesma pessoa. A segunda abordagem consiste em uma rede neural triplet, com três sub-redes idênticas e que recebe de entrada uma imagem de referência de uma determinada pessoa, uma segunda imagem da mesma pessoa e outra imagem de uma pessoa diferente. Ambas as redes possuem sub-redes idênticas, formadas por uma rede neural convolucional que irá extrair características gerais de cada imagem e uma rede autoencoder, responsável por tratar as grandes variações que as imagens da entrada podem sofrer. Para analisar e comparar as redes desenvolvidas foram utilizados três datasets, sendo que as medidas de avaliação escolhidas para análise foram a acurácia e a curva CMC. Experimentos realizados comprovaram uma melhora de até 71,05% nos resultados com a utilização do autoencoder nas sub-redes. Além disso, os experimentos também mostraram uma superioridade da rede neural triplet desenvolvida neste trabalho em relação a rede neural siamesa e a outros métodos do estado da arte.
publishDate 2020
dc.date.accessioned.fl_str_mv 2020-10-15T16:53:45Z
dc.date.available.fl_str_mv 2020-10-15T16:53:45Z
dc.date.issued.fl_str_mv 2020-08-18
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv ENEMBRECK, Fábia Isabella Pires. Re-Identificação de pessoas em imagens digitais utilizando redes neurais siamesas e triplet baseadas em uma rede neural convolucional e um autoencoder. 2020. Dissertação (Mestrado em Ciência da Computação) - Universidade Tecnológica Federal do Paraná, Ponta Grossa, 2020.
dc.identifier.uri.fl_str_mv http://repositorio.utfpr.edu.br/jspui/handle/1/5231
identifier_str_mv ENEMBRECK, Fábia Isabella Pires. Re-Identificação de pessoas em imagens digitais utilizando redes neurais siamesas e triplet baseadas em uma rede neural convolucional e um autoencoder. 2020. Dissertação (Mestrado em Ciência da Computação) - Universidade Tecnológica Federal do Paraná, Ponta Grossa, 2020.
url http://repositorio.utfpr.edu.br/jspui/handle/1/5231
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Ponta Grossa
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Ciência da Computação
dc.publisher.initials.fl_str_mv UTFPR
dc.publisher.country.fl_str_mv Brasil
publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Ponta Grossa
dc.source.none.fl_str_mv reponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
instname:Universidade Tecnológica Federal do Paraná (UTFPR)
instacron:UTFPR
instname_str Universidade Tecnológica Federal do Paraná (UTFPR)
instacron_str UTFPR
institution UTFPR
reponame_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
collection Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
bitstream.url.fl_str_mv http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/5231/1/reidentificacaopessoasimagensdigitais.pdf
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/5231/2/reidentificacaopessoasimagensdigitais.pdf.txt
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/5231/3/reidentificacaopessoasimagensdigitais.pdf.jpg
bitstream.checksum.fl_str_mv 49b053104bc58b6a7bb08bc053197521
d63d50dfd2f9b8260d7a450ee9b8f26e
294cf9cc12883525f511b0715c34e65d
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)
repository.mail.fl_str_mv
_version_ 1805923086947581952