Reconhecimento biométrico usando a região periocular e o olho por meio de extração de características texturais de camadas profundas de uma CNN

Detalhes bibliográficos
Autor(a) principal: Barcellos, William
Data de Publicação: 2022
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da USP
Texto Completo: https://www.teses.usp.br/teses/disponiveis/18/18152/tde-16082022-103558/
Resumo: As Redes Neurais Convolucionais (CNN do inglês Convolutional Neural Network) se tornaram o estado da arte para reconhecimento de imagem. Apesar dos excelentes resultados em alguns problemas de visão computacional, treinar uma CNN a partir do zero às vezes é difícil devido ao número limitado de amostras rotuladas de imagens disponíveis. Algumas estratégias foram desenvolvidas visando a solução para esse tipo de problema, como aumento de dados, transferência de aprendizado com ajuste fino ou usando uma CNN como um extrator de características. Biometria da íris e da região periocular são problemas típicos. Os conjuntos de dados disponíveis foram gerados para algoritmos tradicionais de visão computacional e estratégias baseadas em abordagens de aprendizado profundo de ponta a ponta não são em geral viáveis. Com base em alguns bons resultados obtidos por descritores de textura como Local Binary Patterns (LBP) para classificação de íris e da região periocular, propomos neste trabalho aplicar o descritor LBP uniforme (uLBP) nas Ativações das camadas profundas de uma CNN, e utilizar os vetores de características extraídos em processos de reconhecimento biométrico da região periocular e incluindo o olho (íris, esclera, pupila). Avaliamos esta abordagem nas Ativações da CNN AlexNet. Estas Ativações podem ser interpretadas como imagens processadas pelos filtros da CNN previamente treinada, apresentando características discriminantes de textura. Os resultados mostram que, ao se aplicar esse descritor às Ativações das camadas da CNN AlexNet, foram obtidos melhores resultados do que com as metodologias tradicionais uLBP, HOG, SURF e SIFT, nos testes realizados nas bases de imagens UBIPr Std01, UBIPr_v2, VISOB e MICHE. Esta abordagem fornece assim, uma nova maneira de se utilizar redes neurais profundas em conjunto com técnicas tradicionais de visão computacional, para a solução de problemas de classificação de imagens em bases de imagens com número insuficiente de amostras para treinamento de uma CNN a partir do zero.
id USP_3a0e6f0fa479f40b2a9ae1885b5e8973
oai_identifier_str oai:teses.usp.br:tde-16082022-103558
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str 2721
spelling Reconhecimento biométrico usando a região periocular e o olho por meio de extração de características texturais de camadas profundas de uma CNNBiometric recognition using periocular region and the eye by means of textural feature extraction of a CNN deep layersAlexNetAlexNetBiometriaBiometricsCamadas profundasConvolutional Neural NetworksDeep LayersExtração de característicasEyeFeature ExtractionLBPLBPMICHEMICHEOlhoPeriocularPeriocularRedes Neurais ConvolucionaisUBIPrUBIPrVISOBVISOBAs Redes Neurais Convolucionais (CNN do inglês Convolutional Neural Network) se tornaram o estado da arte para reconhecimento de imagem. Apesar dos excelentes resultados em alguns problemas de visão computacional, treinar uma CNN a partir do zero às vezes é difícil devido ao número limitado de amostras rotuladas de imagens disponíveis. Algumas estratégias foram desenvolvidas visando a solução para esse tipo de problema, como aumento de dados, transferência de aprendizado com ajuste fino ou usando uma CNN como um extrator de características. Biometria da íris e da região periocular são problemas típicos. Os conjuntos de dados disponíveis foram gerados para algoritmos tradicionais de visão computacional e estratégias baseadas em abordagens de aprendizado profundo de ponta a ponta não são em geral viáveis. Com base em alguns bons resultados obtidos por descritores de textura como Local Binary Patterns (LBP) para classificação de íris e da região periocular, propomos neste trabalho aplicar o descritor LBP uniforme (uLBP) nas Ativações das camadas profundas de uma CNN, e utilizar os vetores de características extraídos em processos de reconhecimento biométrico da região periocular e incluindo o olho (íris, esclera, pupila). Avaliamos esta abordagem nas Ativações da CNN AlexNet. Estas Ativações podem ser interpretadas como imagens processadas pelos filtros da CNN previamente treinada, apresentando características discriminantes de textura. Os resultados mostram que, ao se aplicar esse descritor às Ativações das camadas da CNN AlexNet, foram obtidos melhores resultados do que com as metodologias tradicionais uLBP, HOG, SURF e SIFT, nos testes realizados nas bases de imagens UBIPr Std01, UBIPr_v2, VISOB e MICHE. Esta abordagem fornece assim, uma nova maneira de se utilizar redes neurais profundas em conjunto com técnicas tradicionais de visão computacional, para a solução de problemas de classificação de imagens em bases de imagens com número insuficiente de amostras para treinamento de uma CNN a partir do zero.Convolutional Neural Networks have emerged as state-of-the-art for image recognition. Despite their excellent results in some computer vision problems, training a CNN from the scratch is sometimes difficult due to the limited number of available image labeled samples. Some strategies were developed aiming solution for this sort of problem as data augmentation, transfer learning with fine tuning or by using a CNN as a simple feature extractor. Iris and periocular biometric are typical problems. Available datasets were generated for handcraft computer vision algorithms and the strategies based on end-to-end deep learning approaches were not viable. Based on some good results obtained by texture descriptors like Local Binary Patterns (LBP) for iris and periocular region classification, we propose in this work to apply the uniform LBP (uLBP) descriptor in the Activations of deep layers of a CNN and to use the extracted feature vector in biometric recognition processes of the periocular region including the eye (iris, sclera, pupil). We evaluated this approach in the AlexNet Activations. These Activations can be interpreted as images processed by the previously trained CNN filters, and show texture discriminating features. The results show that, when applying this descriptor to the Activations of the AlexNet CNN layers, better results were obtained than with traditional methodologies uLBP, HOG, SURF and SIFT, in tests performed on the UBIPr Std01, UBIPr_v2, VISOB and MICHE image bases. This approach thus provides a new way of using deep neural networks in conjunction with traditional computer vision techniques to solve image classification problems in image bases with an insufficient number of samples to train a CNN from scratch.Biblioteca Digitais de Teses e Dissertações da USPGonzaga, AdilsonBarcellos, William2022-07-26info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/18/18152/tde-16082022-103558/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2022-08-17T19:31:23Zoai:teses.usp.br:tde-16082022-103558Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212022-08-17T19:31:23Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Reconhecimento biométrico usando a região periocular e o olho por meio de extração de características texturais de camadas profundas de uma CNN
Biometric recognition using periocular region and the eye by means of textural feature extraction of a CNN deep layers
title Reconhecimento biométrico usando a região periocular e o olho por meio de extração de características texturais de camadas profundas de uma CNN
spellingShingle Reconhecimento biométrico usando a região periocular e o olho por meio de extração de características texturais de camadas profundas de uma CNN
Barcellos, William
AlexNet
AlexNet
Biometria
Biometrics
Camadas profundas
Convolutional Neural Networks
Deep Layers
Extração de características
Eye
Feature Extraction
LBP
LBP
MICHE
MICHE
Olho
Periocular
Periocular
Redes Neurais Convolucionais
UBIPr
UBIPr
VISOB
VISOB
title_short Reconhecimento biométrico usando a região periocular e o olho por meio de extração de características texturais de camadas profundas de uma CNN
title_full Reconhecimento biométrico usando a região periocular e o olho por meio de extração de características texturais de camadas profundas de uma CNN
title_fullStr Reconhecimento biométrico usando a região periocular e o olho por meio de extração de características texturais de camadas profundas de uma CNN
title_full_unstemmed Reconhecimento biométrico usando a região periocular e o olho por meio de extração de características texturais de camadas profundas de uma CNN
title_sort Reconhecimento biométrico usando a região periocular e o olho por meio de extração de características texturais de camadas profundas de uma CNN
author Barcellos, William
author_facet Barcellos, William
author_role author
dc.contributor.none.fl_str_mv Gonzaga, Adilson
dc.contributor.author.fl_str_mv Barcellos, William
dc.subject.por.fl_str_mv AlexNet
AlexNet
Biometria
Biometrics
Camadas profundas
Convolutional Neural Networks
Deep Layers
Extração de características
Eye
Feature Extraction
LBP
LBP
MICHE
MICHE
Olho
Periocular
Periocular
Redes Neurais Convolucionais
UBIPr
UBIPr
VISOB
VISOB
topic AlexNet
AlexNet
Biometria
Biometrics
Camadas profundas
Convolutional Neural Networks
Deep Layers
Extração de características
Eye
Feature Extraction
LBP
LBP
MICHE
MICHE
Olho
Periocular
Periocular
Redes Neurais Convolucionais
UBIPr
UBIPr
VISOB
VISOB
description As Redes Neurais Convolucionais (CNN do inglês Convolutional Neural Network) se tornaram o estado da arte para reconhecimento de imagem. Apesar dos excelentes resultados em alguns problemas de visão computacional, treinar uma CNN a partir do zero às vezes é difícil devido ao número limitado de amostras rotuladas de imagens disponíveis. Algumas estratégias foram desenvolvidas visando a solução para esse tipo de problema, como aumento de dados, transferência de aprendizado com ajuste fino ou usando uma CNN como um extrator de características. Biometria da íris e da região periocular são problemas típicos. Os conjuntos de dados disponíveis foram gerados para algoritmos tradicionais de visão computacional e estratégias baseadas em abordagens de aprendizado profundo de ponta a ponta não são em geral viáveis. Com base em alguns bons resultados obtidos por descritores de textura como Local Binary Patterns (LBP) para classificação de íris e da região periocular, propomos neste trabalho aplicar o descritor LBP uniforme (uLBP) nas Ativações das camadas profundas de uma CNN, e utilizar os vetores de características extraídos em processos de reconhecimento biométrico da região periocular e incluindo o olho (íris, esclera, pupila). Avaliamos esta abordagem nas Ativações da CNN AlexNet. Estas Ativações podem ser interpretadas como imagens processadas pelos filtros da CNN previamente treinada, apresentando características discriminantes de textura. Os resultados mostram que, ao se aplicar esse descritor às Ativações das camadas da CNN AlexNet, foram obtidos melhores resultados do que com as metodologias tradicionais uLBP, HOG, SURF e SIFT, nos testes realizados nas bases de imagens UBIPr Std01, UBIPr_v2, VISOB e MICHE. Esta abordagem fornece assim, uma nova maneira de se utilizar redes neurais profundas em conjunto com técnicas tradicionais de visão computacional, para a solução de problemas de classificação de imagens em bases de imagens com número insuficiente de amostras para treinamento de uma CNN a partir do zero.
publishDate 2022
dc.date.none.fl_str_mv 2022-07-26
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/18/18152/tde-16082022-103558/
url https://www.teses.usp.br/teses/disponiveis/18/18152/tde-16082022-103558/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1809090776282431488