Re-Identificação de pessoas em imagens digitais utilizando redes neurais siamesas e triplet baseadas em uma rede neural convolucional e um autoencoder
Autor(a) principal: | |
---|---|
Data de Publicação: | 2020 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
Texto Completo: | http://repositorio.utfpr.edu.br/jspui/handle/1/5231 |
Resumo: | Em ambientes monitorados por câmeras de segurança, o problema de determinar se uma pessoa que está sendo observada já esteve presente na cena ou não, independente se o sistema utiliza uma ou mais câmeras, é chamado de re-identificação de pessoas. Este problema é considerado desafiador, uma vez que as imagens obtidas por câmeras estão sujeitas a sofrer grandes variações, como iluminação e perspectiva. Além disso, pessoas em imagens podem passar por transformações e oclusões parciais. Com isso, este trabalho tem como objetivo o desenvolvimento de duas abordagens para re-identificação de pessoas que sejam robustas a essas variações, por meio de técnicas de aprendizagem profunda. A primeira abordagem proposta utiliza uma arquitetura de rede neural siamesa, composta por duas sub-redes idênticas, esse modelo recebe duas imagens de entrada que podem ser ou não de uma mesma pessoa. A segunda abordagem consiste em uma rede neural triplet, com três sub-redes idênticas e que recebe de entrada uma imagem de referência de uma determinada pessoa, uma segunda imagem da mesma pessoa e outra imagem de uma pessoa diferente. Ambas as redes possuem sub-redes idênticas, formadas por uma rede neural convolucional que irá extrair características gerais de cada imagem e uma rede autoencoder, responsável por tratar as grandes variações que as imagens da entrada podem sofrer. Para analisar e comparar as redes desenvolvidas foram utilizados três datasets, sendo que as medidas de avaliação escolhidas para análise foram a acurácia e a curva CMC. Experimentos realizados comprovaram uma melhora de até 71,05% nos resultados com a utilização do autoencoder nas sub-redes. Além disso, os experimentos também mostraram uma superioridade da rede neural triplet desenvolvida neste trabalho em relação a rede neural siamesa e a outros métodos do estado da arte. |
id |
UTFPR-12_3bd793f4533dbf2d49c32d9ad912e6e9 |
---|---|
oai_identifier_str |
oai:repositorio.utfpr.edu.br:1/5231 |
network_acronym_str |
UTFPR-12 |
network_name_str |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
repository_id_str |
|
spelling |
2020-10-15T16:53:45Z2020-10-15T16:53:45Z2020-08-18ENEMBRECK, Fábia Isabella Pires. Re-Identificação de pessoas em imagens digitais utilizando redes neurais siamesas e triplet baseadas em uma rede neural convolucional e um autoencoder. 2020. Dissertação (Mestrado em Ciência da Computação) - Universidade Tecnológica Federal do Paraná, Ponta Grossa, 2020.http://repositorio.utfpr.edu.br/jspui/handle/1/5231Em ambientes monitorados por câmeras de segurança, o problema de determinar se uma pessoa que está sendo observada já esteve presente na cena ou não, independente se o sistema utiliza uma ou mais câmeras, é chamado de re-identificação de pessoas. Este problema é considerado desafiador, uma vez que as imagens obtidas por câmeras estão sujeitas a sofrer grandes variações, como iluminação e perspectiva. Além disso, pessoas em imagens podem passar por transformações e oclusões parciais. Com isso, este trabalho tem como objetivo o desenvolvimento de duas abordagens para re-identificação de pessoas que sejam robustas a essas variações, por meio de técnicas de aprendizagem profunda. A primeira abordagem proposta utiliza uma arquitetura de rede neural siamesa, composta por duas sub-redes idênticas, esse modelo recebe duas imagens de entrada que podem ser ou não de uma mesma pessoa. A segunda abordagem consiste em uma rede neural triplet, com três sub-redes idênticas e que recebe de entrada uma imagem de referência de uma determinada pessoa, uma segunda imagem da mesma pessoa e outra imagem de uma pessoa diferente. Ambas as redes possuem sub-redes idênticas, formadas por uma rede neural convolucional que irá extrair características gerais de cada imagem e uma rede autoencoder, responsável por tratar as grandes variações que as imagens da entrada podem sofrer. Para analisar e comparar as redes desenvolvidas foram utilizados três datasets, sendo que as medidas de avaliação escolhidas para análise foram a acurácia e a curva CMC. Experimentos realizados comprovaram uma melhora de até 71,05% nos resultados com a utilização do autoencoder nas sub-redes. Além disso, os experimentos também mostraram uma superioridade da rede neural triplet desenvolvida neste trabalho em relação a rede neural siamesa e a outros métodos do estado da arte.In environments monitored by security cameras, the problem of identifying if a person being watched has ever been in the scene or not, independent of the system uses one or more cameras, is called person re-identification. This problem is considered challenging, since the images obtained by cameras are subject to many variations, such as lighting and perspective. In addition, people in pictures may undergo transformations and partial occlusions. This work aims to develop two approaches for person re-identification robust to these variations, through deep learning techniques. The first approach proposed uses a Siamese neural network architecture, composed of two identical subnets, this model receives two input images that may or may not be from the same person. The second approach consists of a triplet neural network, with three identical subnets, which receives a reference image from a certain person, a second image from the same person and another image from a different person. Both networks have identical subnets, formed by a convolutional neural network that will extract general characteristics from each image and an autoencoder network, responsible for dealing with the great variations that the input images may undergo. To analyze and compare the developed networks, three datasets were used, and the metrics chosen for analysis were accuracy and the CMC curve. Experiments carried out proved an improvement up to 71.05% in the results with the use of the autoencoder in the subnets. Also, the experiments showed a superiority of the triplet neural network developed in this work to the siamese neural network and other state-of-the-art methods.Universidade Tecnológica Federal do Paraná (UTFPR)porUniversidade Tecnológica Federal do ParanáPonta GrossaPrograma de Pós-Graduação em Ciência da ComputaçãoUTFPRBrasilCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOEngenharia/Tecnologia/GestãoPessoas - IdentificaçãoVigilância eletrônicaImagens digitaisRedes neurais (Computação)Persons - IdentificationElectronic surveillanceDigital imagesNeural networks (Computer science)Re-Identificação de pessoas em imagens digitais utilizando redes neurais siamesas e triplet baseadas em uma rede neural convolucional e um autoencoderPerson re-identification in digital images using siamese and triplet neural networks based on a convolutional neural network and an autoencoderinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisPonta GrossaMorais, Erikson Freitas dehttps://orcid.org/0000-0002-0845-7457http://lattes.cnpq.br/1716165820460791Morais, Erikson Freitas dehttps://orcid.org/0000-0002-0845-7457http://lattes.cnpq.br/1716165820460791Senger, Luciano Joséhttps://orcid.org/0000-0001-6633-006Xhttp://lattes.cnpq.br/6880696447532558Martins, Marcella Scoczynski Ribeirohttps://orcid.org/0000-0002-5716-4968http://lattes.cnpq.br/5212122361603572Schwartz, William Robsonhttps://orcid.org/0000-0003-1449-8834http://lattes.cnpq.br/0704592200063682https://orcid.org/0000-0001-7364-0912http://lattes.cnpq.br/4822479229399141Enembreck, Fábia Isabella Piresinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))instname:Universidade Tecnológica Federal do Paraná (UTFPR)instacron:UTFPRORIGINALreidentificacaopessoasimagensdigitais.pdfapplication/pdf3185459http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/5231/1/reidentificacaopessoasimagensdigitais.pdf49b053104bc58b6a7bb08bc053197521MD51TEXTreidentificacaopessoasimagensdigitais.pdf.txtreidentificacaopessoasimagensdigitais.pdf.txtExtracted texttext/plain153089http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/5231/2/reidentificacaopessoasimagensdigitais.pdf.txtd63d50dfd2f9b8260d7a450ee9b8f26eMD52THUMBNAILreidentificacaopessoasimagensdigitais.pdf.jpgreidentificacaopessoasimagensdigitais.pdf.jpgGenerated Thumbnailimage/jpeg1325http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/5231/3/reidentificacaopessoasimagensdigitais.pdf.jpg294cf9cc12883525f511b0715c34e65dMD531/52312020-10-16 03:01:10.857oai:repositorio.utfpr.edu.br:1/5231Repositório de PublicaçõesPUBhttp://repositorio.utfpr.edu.br:8080/oai/requestopendoar:2020-10-16T06:01:10Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)false |
dc.title.pt_BR.fl_str_mv |
Re-Identificação de pessoas em imagens digitais utilizando redes neurais siamesas e triplet baseadas em uma rede neural convolucional e um autoencoder |
dc.title.alternative.pt_BR.fl_str_mv |
Person re-identification in digital images using siamese and triplet neural networks based on a convolutional neural network and an autoencoder |
title |
Re-Identificação de pessoas em imagens digitais utilizando redes neurais siamesas e triplet baseadas em uma rede neural convolucional e um autoencoder |
spellingShingle |
Re-Identificação de pessoas em imagens digitais utilizando redes neurais siamesas e triplet baseadas em uma rede neural convolucional e um autoencoder Enembreck, Fábia Isabella Pires CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO Pessoas - Identificação Vigilância eletrônica Imagens digitais Redes neurais (Computação) Persons - Identification Electronic surveillance Digital images Neural networks (Computer science) Engenharia/Tecnologia/Gestão |
title_short |
Re-Identificação de pessoas em imagens digitais utilizando redes neurais siamesas e triplet baseadas em uma rede neural convolucional e um autoencoder |
title_full |
Re-Identificação de pessoas em imagens digitais utilizando redes neurais siamesas e triplet baseadas em uma rede neural convolucional e um autoencoder |
title_fullStr |
Re-Identificação de pessoas em imagens digitais utilizando redes neurais siamesas e triplet baseadas em uma rede neural convolucional e um autoencoder |
title_full_unstemmed |
Re-Identificação de pessoas em imagens digitais utilizando redes neurais siamesas e triplet baseadas em uma rede neural convolucional e um autoencoder |
title_sort |
Re-Identificação de pessoas em imagens digitais utilizando redes neurais siamesas e triplet baseadas em uma rede neural convolucional e um autoencoder |
author |
Enembreck, Fábia Isabella Pires |
author_facet |
Enembreck, Fábia Isabella Pires |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Morais, Erikson Freitas de |
dc.contributor.advisor1ID.fl_str_mv |
https://orcid.org/0000-0002-0845-7457 |
dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/1716165820460791 |
dc.contributor.referee1.fl_str_mv |
Morais, Erikson Freitas de |
dc.contributor.referee1ID.fl_str_mv |
https://orcid.org/0000-0002-0845-7457 |
dc.contributor.referee1Lattes.fl_str_mv |
http://lattes.cnpq.br/1716165820460791 |
dc.contributor.referee2.fl_str_mv |
Senger, Luciano José |
dc.contributor.referee2ID.fl_str_mv |
https://orcid.org/0000-0001-6633-006X |
dc.contributor.referee2Lattes.fl_str_mv |
http://lattes.cnpq.br/6880696447532558 |
dc.contributor.referee3.fl_str_mv |
Martins, Marcella Scoczynski Ribeiro |
dc.contributor.referee3ID.fl_str_mv |
https://orcid.org/0000-0002-5716-4968 |
dc.contributor.referee3Lattes.fl_str_mv |
http://lattes.cnpq.br/5212122361603572 |
dc.contributor.referee4.fl_str_mv |
Schwartz, William Robson |
dc.contributor.referee4ID.fl_str_mv |
https://orcid.org/0000-0003-1449-8834 |
dc.contributor.referee4Lattes.fl_str_mv |
http://lattes.cnpq.br/0704592200063682 |
dc.contributor.authorID.fl_str_mv |
https://orcid.org/0000-0001-7364-0912 |
dc.contributor.authorLattes.fl_str_mv |
http://lattes.cnpq.br/4822479229399141 |
dc.contributor.author.fl_str_mv |
Enembreck, Fábia Isabella Pires |
contributor_str_mv |
Morais, Erikson Freitas de Morais, Erikson Freitas de Senger, Luciano José Martins, Marcella Scoczynski Ribeiro Schwartz, William Robson |
dc.subject.cnpq.fl_str_mv |
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
topic |
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO Pessoas - Identificação Vigilância eletrônica Imagens digitais Redes neurais (Computação) Persons - Identification Electronic surveillance Digital images Neural networks (Computer science) Engenharia/Tecnologia/Gestão |
dc.subject.por.fl_str_mv |
Pessoas - Identificação Vigilância eletrônica Imagens digitais Redes neurais (Computação) Persons - Identification Electronic surveillance Digital images Neural networks (Computer science) |
dc.subject.capes.pt_BR.fl_str_mv |
Engenharia/Tecnologia/Gestão |
description |
Em ambientes monitorados por câmeras de segurança, o problema de determinar se uma pessoa que está sendo observada já esteve presente na cena ou não, independente se o sistema utiliza uma ou mais câmeras, é chamado de re-identificação de pessoas. Este problema é considerado desafiador, uma vez que as imagens obtidas por câmeras estão sujeitas a sofrer grandes variações, como iluminação e perspectiva. Além disso, pessoas em imagens podem passar por transformações e oclusões parciais. Com isso, este trabalho tem como objetivo o desenvolvimento de duas abordagens para re-identificação de pessoas que sejam robustas a essas variações, por meio de técnicas de aprendizagem profunda. A primeira abordagem proposta utiliza uma arquitetura de rede neural siamesa, composta por duas sub-redes idênticas, esse modelo recebe duas imagens de entrada que podem ser ou não de uma mesma pessoa. A segunda abordagem consiste em uma rede neural triplet, com três sub-redes idênticas e que recebe de entrada uma imagem de referência de uma determinada pessoa, uma segunda imagem da mesma pessoa e outra imagem de uma pessoa diferente. Ambas as redes possuem sub-redes idênticas, formadas por uma rede neural convolucional que irá extrair características gerais de cada imagem e uma rede autoencoder, responsável por tratar as grandes variações que as imagens da entrada podem sofrer. Para analisar e comparar as redes desenvolvidas foram utilizados três datasets, sendo que as medidas de avaliação escolhidas para análise foram a acurácia e a curva CMC. Experimentos realizados comprovaram uma melhora de até 71,05% nos resultados com a utilização do autoencoder nas sub-redes. Além disso, os experimentos também mostraram uma superioridade da rede neural triplet desenvolvida neste trabalho em relação a rede neural siamesa e a outros métodos do estado da arte. |
publishDate |
2020 |
dc.date.accessioned.fl_str_mv |
2020-10-15T16:53:45Z |
dc.date.available.fl_str_mv |
2020-10-15T16:53:45Z |
dc.date.issued.fl_str_mv |
2020-08-18 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
ENEMBRECK, Fábia Isabella Pires. Re-Identificação de pessoas em imagens digitais utilizando redes neurais siamesas e triplet baseadas em uma rede neural convolucional e um autoencoder. 2020. Dissertação (Mestrado em Ciência da Computação) - Universidade Tecnológica Federal do Paraná, Ponta Grossa, 2020. |
dc.identifier.uri.fl_str_mv |
http://repositorio.utfpr.edu.br/jspui/handle/1/5231 |
identifier_str_mv |
ENEMBRECK, Fábia Isabella Pires. Re-Identificação de pessoas em imagens digitais utilizando redes neurais siamesas e triplet baseadas em uma rede neural convolucional e um autoencoder. 2020. Dissertação (Mestrado em Ciência da Computação) - Universidade Tecnológica Federal do Paraná, Ponta Grossa, 2020. |
url |
http://repositorio.utfpr.edu.br/jspui/handle/1/5231 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Tecnológica Federal do Paraná Ponta Grossa |
dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Ciência da Computação |
dc.publisher.initials.fl_str_mv |
UTFPR |
dc.publisher.country.fl_str_mv |
Brasil |
publisher.none.fl_str_mv |
Universidade Tecnológica Federal do Paraná Ponta Grossa |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) instname:Universidade Tecnológica Federal do Paraná (UTFPR) instacron:UTFPR |
instname_str |
Universidade Tecnológica Federal do Paraná (UTFPR) |
instacron_str |
UTFPR |
institution |
UTFPR |
reponame_str |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
collection |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
bitstream.url.fl_str_mv |
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/5231/1/reidentificacaopessoasimagensdigitais.pdf http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/5231/2/reidentificacaopessoasimagensdigitais.pdf.txt http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/5231/3/reidentificacaopessoasimagensdigitais.pdf.jpg |
bitstream.checksum.fl_str_mv |
49b053104bc58b6a7bb08bc053197521 d63d50dfd2f9b8260d7a450ee9b8f26e 294cf9cc12883525f511b0715c34e65d |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR) |
repository.mail.fl_str_mv |
|
_version_ |
1805923086947581952 |