Redes neurais deep learning aplicadas ao reconhecimento facial

Detalhes bibliográficos
Autor(a) principal: Chaves, Rodrigo Reuse
Data de Publicação: 2018
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UCS
Texto Completo: https://repositorio.ucs.br/11338/4771
Resumo: O reconhecimento facial por computadores ainda é uma tarefa desafiadora. Sistemas de redes neurais buscam soluções para que a tarefa de reconhecimento seja cada vez mais uma realidade. Hoje, as redes neurais convolucionais alcançam os resultados mais precisos se comparado a outros modelos de redes neurais. As redes neurais convolucionais são bem adaptadas para a classificação de imagens, porque se utilizam da estrutura espacial da imagem para realizar a análise. Por conta disso, redes neurais convolucionais e algumas variantes próximas são as mais utilizadas no reconhecimento de faces e imagens em geral. Técnicas de aprendizado de máquina chamadas de deep learning são aplicadas em conjunto com as redes neurais artificiais na tarefa de reconhecimento. O aprendizado de máquina realiza a busca de padrões nas imagens. O resultado da busca é aquisição de conhecimento, o que possibilita a adaptação necessária da rede neural para realizar o reconhecimento das imagens. A busca de padrões é feita através de treinamentos, que são realizados diversas vezes sobre uma base de dados com imagens de exemplo. Para o reconhecimento facial, o método de aprendizado mais utilizado é o aprendizado de máquina supervisionado. Nesse método a base de dados com imagens de exemplo já é previamente rotulada, indicando qual é a classe de cada imagem. A implementação de redes neurais artificiais e utilização de métodos de deep learning normalmente são feitos com o auxilio de frameworks. Existem frameworks open source voltados para a criação de redes neurais e aprendizado de máquina. Eles agilizam o processo de criação de sistemas de reconhecimento, já que criar um sistema de reconhecimento de imagens apartir do zero é algo complexo e demorado. Os frameworks possuem arquiteturas de redes neurais e métodos de aprendizado de máquina já implementados, deixando ao programador a tarefa de parametrização. No experimento apresentado nesse trabalho, foi realizado a identificação facial em tempo real de 10 pessoas. Utilizando 3 arquiteturas de rede neural diferentes, Inception V3, Inception V4 e Mobilenet V1 224. Todas as arquiteturas obtiveram as mesmas imagens de treinamento, 1149 fotos, que variou entre 74 e 160 fotos de cada um dos participantes. Na análise das imagens foi utilizado uma câmera de 13 Mpx, para a captura das imagens, e um equipamento Raspeberry para o processamento dos dados. A arquitetura Inception V4 não pode ser iniciada no equipamento Raspeberry, pois o mesmo não conseguiu carregá-la devido a pouco quantidade de memória RAM, 1 GB, e, portanto, os seus resultados não foram contabilizados. Quanto as demais, Inception V3 e Mobilenet V1 224, obtiveram resultados distintos em termos de acurácia e velocidade de processamento. A Inception V3 obteve uma maior acurácia, enquanto a Mobilenet V1 224 obteve a maior velocidade de processamento (sic).
id UCS_fb77d27378202e977e7596a420bade12
oai_identifier_str oai:repositorio.ucs.br:11338/4771
network_acronym_str UCS
network_name_str Repositório Institucional da UCS
repository_id_str
spelling Chaves, Rodrigo ReuseLima, Maria de Fátima Webber do PradoMorales, Andréa CantarelliWebber, Carine Geltrudes2019-06-25T16:37:59Z2019-06-25T16:37:59Z2019-06-252018-12-13https://repositorio.ucs.br/11338/4771O reconhecimento facial por computadores ainda é uma tarefa desafiadora. Sistemas de redes neurais buscam soluções para que a tarefa de reconhecimento seja cada vez mais uma realidade. Hoje, as redes neurais convolucionais alcançam os resultados mais precisos se comparado a outros modelos de redes neurais. As redes neurais convolucionais são bem adaptadas para a classificação de imagens, porque se utilizam da estrutura espacial da imagem para realizar a análise. Por conta disso, redes neurais convolucionais e algumas variantes próximas são as mais utilizadas no reconhecimento de faces e imagens em geral. Técnicas de aprendizado de máquina chamadas de deep learning são aplicadas em conjunto com as redes neurais artificiais na tarefa de reconhecimento. O aprendizado de máquina realiza a busca de padrões nas imagens. O resultado da busca é aquisição de conhecimento, o que possibilita a adaptação necessária da rede neural para realizar o reconhecimento das imagens. A busca de padrões é feita através de treinamentos, que são realizados diversas vezes sobre uma base de dados com imagens de exemplo. Para o reconhecimento facial, o método de aprendizado mais utilizado é o aprendizado de máquina supervisionado. Nesse método a base de dados com imagens de exemplo já é previamente rotulada, indicando qual é a classe de cada imagem. A implementação de redes neurais artificiais e utilização de métodos de deep learning normalmente são feitos com o auxilio de frameworks. Existem frameworks open source voltados para a criação de redes neurais e aprendizado de máquina. Eles agilizam o processo de criação de sistemas de reconhecimento, já que criar um sistema de reconhecimento de imagens apartir do zero é algo complexo e demorado. Os frameworks possuem arquiteturas de redes neurais e métodos de aprendizado de máquina já implementados, deixando ao programador a tarefa de parametrização. No experimento apresentado nesse trabalho, foi realizado a identificação facial em tempo real de 10 pessoas. Utilizando 3 arquiteturas de rede neural diferentes, Inception V3, Inception V4 e Mobilenet V1 224. Todas as arquiteturas obtiveram as mesmas imagens de treinamento, 1149 fotos, que variou entre 74 e 160 fotos de cada um dos participantes. Na análise das imagens foi utilizado uma câmera de 13 Mpx, para a captura das imagens, e um equipamento Raspeberry para o processamento dos dados. A arquitetura Inception V4 não pode ser iniciada no equipamento Raspeberry, pois o mesmo não conseguiu carregá-la devido a pouco quantidade de memória RAM, 1 GB, e, portanto, os seus resultados não foram contabilizados. Quanto as demais, Inception V3 e Mobilenet V1 224, obtiveram resultados distintos em termos de acurácia e velocidade de processamento. A Inception V3 obteve uma maior acurácia, enquanto a Mobilenet V1 224 obteve a maior velocidade de processamento (sic).Inteligência artificialRedes neurais (Computação)Percepção facialRedes neurais deep learning aplicadas ao reconhecimento facialinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisporreponame:Repositório Institucional da UCSinstname:Universidade de Caxias do Sul (UCS)instacron:UCSinfo:eu-repo/semantics/openAccessUniversidade de Caxias do SulBacharelado em Ciência da ComputaçãoTHUMBNAILTCC Rodrigo Reuse Chaves.pdf.jpgTCC Rodrigo Reuse Chaves.pdf.jpgGenerated Thumbnailimage/jpeg1281https://repositorio.ucs.br/xmlui/bitstream/11338/4771/4/TCC%20Rodrigo%20Reuse%20Chaves.pdf.jpgf7d60a964226779ea9eca443d4d7429bMD54ORIGINALTCC Rodrigo Reuse Chaves.pdfTCC Rodrigo Reuse Chaves.pdfapplication/pdf2465114https://repositorio.ucs.br/xmlui/bitstream/11338/4771/1/TCC%20Rodrigo%20Reuse%20Chaves.pdf3cd8c0db4789119589f37035cdb06c11MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-8510https://repositorio.ucs.br/xmlui/bitstream/11338/4771/2/license.txt0bfdaf5679b458f1c173109e3e8d8e40MD52TEXTTCC Rodrigo Reuse Chaves.pdf.txtTCC Rodrigo Reuse Chaves.pdf.txtExtracted texttext/plain112822https://repositorio.ucs.br/xmlui/bitstream/11338/4771/3/TCC%20Rodrigo%20Reuse%20Chaves.pdf.txtf0941cd54349ee96917fcded6ec87004MD5311338/47712020-04-29 15:17:33.54oai:repositorio.ucs.br:11338/4771Repositório de Publicaçõeshttp://repositorio.ucs.br/oai/requestopendoar:2024-05-06T10:04:54.570174Repositório Institucional da UCS - Universidade de Caxias do Sul (UCS)false
dc.title.pt_BR.fl_str_mv Redes neurais deep learning aplicadas ao reconhecimento facial
title Redes neurais deep learning aplicadas ao reconhecimento facial
spellingShingle Redes neurais deep learning aplicadas ao reconhecimento facial
Chaves, Rodrigo Reuse
Inteligência artificial
Redes neurais (Computação)
Percepção facial
title_short Redes neurais deep learning aplicadas ao reconhecimento facial
title_full Redes neurais deep learning aplicadas ao reconhecimento facial
title_fullStr Redes neurais deep learning aplicadas ao reconhecimento facial
title_full_unstemmed Redes neurais deep learning aplicadas ao reconhecimento facial
title_sort Redes neurais deep learning aplicadas ao reconhecimento facial
author Chaves, Rodrigo Reuse
author_facet Chaves, Rodrigo Reuse
author_role author
dc.contributor.other.none.fl_str_mv Lima, Maria de Fátima Webber do Prado
Morales, Andréa Cantarelli
dc.contributor.author.fl_str_mv Chaves, Rodrigo Reuse
dc.contributor.advisor1.fl_str_mv Webber, Carine Geltrudes
contributor_str_mv Webber, Carine Geltrudes
dc.subject.por.fl_str_mv Inteligência artificial
Redes neurais (Computação)
Percepção facial
topic Inteligência artificial
Redes neurais (Computação)
Percepção facial
description O reconhecimento facial por computadores ainda é uma tarefa desafiadora. Sistemas de redes neurais buscam soluções para que a tarefa de reconhecimento seja cada vez mais uma realidade. Hoje, as redes neurais convolucionais alcançam os resultados mais precisos se comparado a outros modelos de redes neurais. As redes neurais convolucionais são bem adaptadas para a classificação de imagens, porque se utilizam da estrutura espacial da imagem para realizar a análise. Por conta disso, redes neurais convolucionais e algumas variantes próximas são as mais utilizadas no reconhecimento de faces e imagens em geral. Técnicas de aprendizado de máquina chamadas de deep learning são aplicadas em conjunto com as redes neurais artificiais na tarefa de reconhecimento. O aprendizado de máquina realiza a busca de padrões nas imagens. O resultado da busca é aquisição de conhecimento, o que possibilita a adaptação necessária da rede neural para realizar o reconhecimento das imagens. A busca de padrões é feita através de treinamentos, que são realizados diversas vezes sobre uma base de dados com imagens de exemplo. Para o reconhecimento facial, o método de aprendizado mais utilizado é o aprendizado de máquina supervisionado. Nesse método a base de dados com imagens de exemplo já é previamente rotulada, indicando qual é a classe de cada imagem. A implementação de redes neurais artificiais e utilização de métodos de deep learning normalmente são feitos com o auxilio de frameworks. Existem frameworks open source voltados para a criação de redes neurais e aprendizado de máquina. Eles agilizam o processo de criação de sistemas de reconhecimento, já que criar um sistema de reconhecimento de imagens apartir do zero é algo complexo e demorado. Os frameworks possuem arquiteturas de redes neurais e métodos de aprendizado de máquina já implementados, deixando ao programador a tarefa de parametrização. No experimento apresentado nesse trabalho, foi realizado a identificação facial em tempo real de 10 pessoas. Utilizando 3 arquiteturas de rede neural diferentes, Inception V3, Inception V4 e Mobilenet V1 224. Todas as arquiteturas obtiveram as mesmas imagens de treinamento, 1149 fotos, que variou entre 74 e 160 fotos de cada um dos participantes. Na análise das imagens foi utilizado uma câmera de 13 Mpx, para a captura das imagens, e um equipamento Raspeberry para o processamento dos dados. A arquitetura Inception V4 não pode ser iniciada no equipamento Raspeberry, pois o mesmo não conseguiu carregá-la devido a pouco quantidade de memória RAM, 1 GB, e, portanto, os seus resultados não foram contabilizados. Quanto as demais, Inception V3 e Mobilenet V1 224, obtiveram resultados distintos em termos de acurácia e velocidade de processamento. A Inception V3 obteve uma maior acurácia, enquanto a Mobilenet V1 224 obteve a maior velocidade de processamento (sic).
publishDate 2018
dc.date.submitted.none.fl_str_mv 2018-12-13
dc.date.accessioned.fl_str_mv 2019-06-25T16:37:59Z
dc.date.available.fl_str_mv 2019-06-25T16:37:59Z
dc.date.issued.fl_str_mv 2019-06-25
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.ucs.br/11338/4771
url https://repositorio.ucs.br/11338/4771
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.source.none.fl_str_mv reponame:Repositório Institucional da UCS
instname:Universidade de Caxias do Sul (UCS)
instacron:UCS
instname_str Universidade de Caxias do Sul (UCS)
instacron_str UCS
institution UCS
reponame_str Repositório Institucional da UCS
collection Repositório Institucional da UCS
bitstream.url.fl_str_mv https://repositorio.ucs.br/xmlui/bitstream/11338/4771/4/TCC%20Rodrigo%20Reuse%20Chaves.pdf.jpg
https://repositorio.ucs.br/xmlui/bitstream/11338/4771/1/TCC%20Rodrigo%20Reuse%20Chaves.pdf
https://repositorio.ucs.br/xmlui/bitstream/11338/4771/2/license.txt
https://repositorio.ucs.br/xmlui/bitstream/11338/4771/3/TCC%20Rodrigo%20Reuse%20Chaves.pdf.txt
bitstream.checksum.fl_str_mv f7d60a964226779ea9eca443d4d7429b
3cd8c0db4789119589f37035cdb06c11
0bfdaf5679b458f1c173109e3e8d8e40
f0941cd54349ee96917fcded6ec87004
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UCS - Universidade de Caxias do Sul (UCS)
repository.mail.fl_str_mv
_version_ 1813258451683377152