Reconhecimento biométrico usando a região periocular e o olho por meio de extração de características texturais de camadas profundas de uma CNN
Autor(a) principal: | |
---|---|
Data de Publicação: | 2022 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da USP |
Texto Completo: | https://www.teses.usp.br/teses/disponiveis/18/18152/tde-16082022-103558/ |
Resumo: | As Redes Neurais Convolucionais (CNN do inglês Convolutional Neural Network) se tornaram o estado da arte para reconhecimento de imagem. Apesar dos excelentes resultados em alguns problemas de visão computacional, treinar uma CNN a partir do zero às vezes é difícil devido ao número limitado de amostras rotuladas de imagens disponíveis. Algumas estratégias foram desenvolvidas visando a solução para esse tipo de problema, como aumento de dados, transferência de aprendizado com ajuste fino ou usando uma CNN como um extrator de características. Biometria da íris e da região periocular são problemas típicos. Os conjuntos de dados disponíveis foram gerados para algoritmos tradicionais de visão computacional e estratégias baseadas em abordagens de aprendizado profundo de ponta a ponta não são em geral viáveis. Com base em alguns bons resultados obtidos por descritores de textura como Local Binary Patterns (LBP) para classificação de íris e da região periocular, propomos neste trabalho aplicar o descritor LBP uniforme (uLBP) nas Ativações das camadas profundas de uma CNN, e utilizar os vetores de características extraídos em processos de reconhecimento biométrico da região periocular e incluindo o olho (íris, esclera, pupila). Avaliamos esta abordagem nas Ativações da CNN AlexNet. Estas Ativações podem ser interpretadas como imagens processadas pelos filtros da CNN previamente treinada, apresentando características discriminantes de textura. Os resultados mostram que, ao se aplicar esse descritor às Ativações das camadas da CNN AlexNet, foram obtidos melhores resultados do que com as metodologias tradicionais uLBP, HOG, SURF e SIFT, nos testes realizados nas bases de imagens UBIPr Std01, UBIPr_v2, VISOB e MICHE. Esta abordagem fornece assim, uma nova maneira de se utilizar redes neurais profundas em conjunto com técnicas tradicionais de visão computacional, para a solução de problemas de classificação de imagens em bases de imagens com número insuficiente de amostras para treinamento de uma CNN a partir do zero. |
id |
USP_3a0e6f0fa479f40b2a9ae1885b5e8973 |
---|---|
oai_identifier_str |
oai:teses.usp.br:tde-16082022-103558 |
network_acronym_str |
USP |
network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
repository_id_str |
2721 |
spelling |
Reconhecimento biométrico usando a região periocular e o olho por meio de extração de características texturais de camadas profundas de uma CNNBiometric recognition using periocular region and the eye by means of textural feature extraction of a CNN deep layersAlexNetAlexNetBiometriaBiometricsCamadas profundasConvolutional Neural NetworksDeep LayersExtração de característicasEyeFeature ExtractionLBPLBPMICHEMICHEOlhoPeriocularPeriocularRedes Neurais ConvolucionaisUBIPrUBIPrVISOBVISOBAs Redes Neurais Convolucionais (CNN do inglês Convolutional Neural Network) se tornaram o estado da arte para reconhecimento de imagem. Apesar dos excelentes resultados em alguns problemas de visão computacional, treinar uma CNN a partir do zero às vezes é difícil devido ao número limitado de amostras rotuladas de imagens disponíveis. Algumas estratégias foram desenvolvidas visando a solução para esse tipo de problema, como aumento de dados, transferência de aprendizado com ajuste fino ou usando uma CNN como um extrator de características. Biometria da íris e da região periocular são problemas típicos. Os conjuntos de dados disponíveis foram gerados para algoritmos tradicionais de visão computacional e estratégias baseadas em abordagens de aprendizado profundo de ponta a ponta não são em geral viáveis. Com base em alguns bons resultados obtidos por descritores de textura como Local Binary Patterns (LBP) para classificação de íris e da região periocular, propomos neste trabalho aplicar o descritor LBP uniforme (uLBP) nas Ativações das camadas profundas de uma CNN, e utilizar os vetores de características extraídos em processos de reconhecimento biométrico da região periocular e incluindo o olho (íris, esclera, pupila). Avaliamos esta abordagem nas Ativações da CNN AlexNet. Estas Ativações podem ser interpretadas como imagens processadas pelos filtros da CNN previamente treinada, apresentando características discriminantes de textura. Os resultados mostram que, ao se aplicar esse descritor às Ativações das camadas da CNN AlexNet, foram obtidos melhores resultados do que com as metodologias tradicionais uLBP, HOG, SURF e SIFT, nos testes realizados nas bases de imagens UBIPr Std01, UBIPr_v2, VISOB e MICHE. Esta abordagem fornece assim, uma nova maneira de se utilizar redes neurais profundas em conjunto com técnicas tradicionais de visão computacional, para a solução de problemas de classificação de imagens em bases de imagens com número insuficiente de amostras para treinamento de uma CNN a partir do zero.Convolutional Neural Networks have emerged as state-of-the-art for image recognition. Despite their excellent results in some computer vision problems, training a CNN from the scratch is sometimes difficult due to the limited number of available image labeled samples. Some strategies were developed aiming solution for this sort of problem as data augmentation, transfer learning with fine tuning or by using a CNN as a simple feature extractor. Iris and periocular biometric are typical problems. Available datasets were generated for handcraft computer vision algorithms and the strategies based on end-to-end deep learning approaches were not viable. Based on some good results obtained by texture descriptors like Local Binary Patterns (LBP) for iris and periocular region classification, we propose in this work to apply the uniform LBP (uLBP) descriptor in the Activations of deep layers of a CNN and to use the extracted feature vector in biometric recognition processes of the periocular region including the eye (iris, sclera, pupil). We evaluated this approach in the AlexNet Activations. These Activations can be interpreted as images processed by the previously trained CNN filters, and show texture discriminating features. The results show that, when applying this descriptor to the Activations of the AlexNet CNN layers, better results were obtained than with traditional methodologies uLBP, HOG, SURF and SIFT, in tests performed on the UBIPr Std01, UBIPr_v2, VISOB and MICHE image bases. This approach thus provides a new way of using deep neural networks in conjunction with traditional computer vision techniques to solve image classification problems in image bases with an insufficient number of samples to train a CNN from scratch.Biblioteca Digitais de Teses e Dissertações da USPGonzaga, AdilsonBarcellos, William2022-07-26info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/18/18152/tde-16082022-103558/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2024-10-09T13:16:04Zoai:teses.usp.br:tde-16082022-103558Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212024-10-09T13:16:04Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
dc.title.none.fl_str_mv |
Reconhecimento biométrico usando a região periocular e o olho por meio de extração de características texturais de camadas profundas de uma CNN Biometric recognition using periocular region and the eye by means of textural feature extraction of a CNN deep layers |
title |
Reconhecimento biométrico usando a região periocular e o olho por meio de extração de características texturais de camadas profundas de uma CNN |
spellingShingle |
Reconhecimento biométrico usando a região periocular e o olho por meio de extração de características texturais de camadas profundas de uma CNN Barcellos, William AlexNet AlexNet Biometria Biometrics Camadas profundas Convolutional Neural Networks Deep Layers Extração de características Eye Feature Extraction LBP LBP MICHE MICHE Olho Periocular Periocular Redes Neurais Convolucionais UBIPr UBIPr VISOB VISOB |
title_short |
Reconhecimento biométrico usando a região periocular e o olho por meio de extração de características texturais de camadas profundas de uma CNN |
title_full |
Reconhecimento biométrico usando a região periocular e o olho por meio de extração de características texturais de camadas profundas de uma CNN |
title_fullStr |
Reconhecimento biométrico usando a região periocular e o olho por meio de extração de características texturais de camadas profundas de uma CNN |
title_full_unstemmed |
Reconhecimento biométrico usando a região periocular e o olho por meio de extração de características texturais de camadas profundas de uma CNN |
title_sort |
Reconhecimento biométrico usando a região periocular e o olho por meio de extração de características texturais de camadas profundas de uma CNN |
author |
Barcellos, William |
author_facet |
Barcellos, William |
author_role |
author |
dc.contributor.none.fl_str_mv |
Gonzaga, Adilson |
dc.contributor.author.fl_str_mv |
Barcellos, William |
dc.subject.por.fl_str_mv |
AlexNet AlexNet Biometria Biometrics Camadas profundas Convolutional Neural Networks Deep Layers Extração de características Eye Feature Extraction LBP LBP MICHE MICHE Olho Periocular Periocular Redes Neurais Convolucionais UBIPr UBIPr VISOB VISOB |
topic |
AlexNet AlexNet Biometria Biometrics Camadas profundas Convolutional Neural Networks Deep Layers Extração de características Eye Feature Extraction LBP LBP MICHE MICHE Olho Periocular Periocular Redes Neurais Convolucionais UBIPr UBIPr VISOB VISOB |
description |
As Redes Neurais Convolucionais (CNN do inglês Convolutional Neural Network) se tornaram o estado da arte para reconhecimento de imagem. Apesar dos excelentes resultados em alguns problemas de visão computacional, treinar uma CNN a partir do zero às vezes é difícil devido ao número limitado de amostras rotuladas de imagens disponíveis. Algumas estratégias foram desenvolvidas visando a solução para esse tipo de problema, como aumento de dados, transferência de aprendizado com ajuste fino ou usando uma CNN como um extrator de características. Biometria da íris e da região periocular são problemas típicos. Os conjuntos de dados disponíveis foram gerados para algoritmos tradicionais de visão computacional e estratégias baseadas em abordagens de aprendizado profundo de ponta a ponta não são em geral viáveis. Com base em alguns bons resultados obtidos por descritores de textura como Local Binary Patterns (LBP) para classificação de íris e da região periocular, propomos neste trabalho aplicar o descritor LBP uniforme (uLBP) nas Ativações das camadas profundas de uma CNN, e utilizar os vetores de características extraídos em processos de reconhecimento biométrico da região periocular e incluindo o olho (íris, esclera, pupila). Avaliamos esta abordagem nas Ativações da CNN AlexNet. Estas Ativações podem ser interpretadas como imagens processadas pelos filtros da CNN previamente treinada, apresentando características discriminantes de textura. Os resultados mostram que, ao se aplicar esse descritor às Ativações das camadas da CNN AlexNet, foram obtidos melhores resultados do que com as metodologias tradicionais uLBP, HOG, SURF e SIFT, nos testes realizados nas bases de imagens UBIPr Std01, UBIPr_v2, VISOB e MICHE. Esta abordagem fornece assim, uma nova maneira de se utilizar redes neurais profundas em conjunto com técnicas tradicionais de visão computacional, para a solução de problemas de classificação de imagens em bases de imagens com número insuficiente de amostras para treinamento de uma CNN a partir do zero. |
publishDate |
2022 |
dc.date.none.fl_str_mv |
2022-07-26 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/18/18152/tde-16082022-103558/ |
url |
https://www.teses.usp.br/teses/disponiveis/18/18152/tde-16082022-103558/ |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
|
dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.coverage.none.fl_str_mv |
|
dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
instname_str |
Universidade de São Paulo (USP) |
instacron_str |
USP |
institution |
USP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
collection |
Biblioteca Digital de Teses e Dissertações da USP |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
_version_ |
1815256512234258432 |