Redes neurais deep learning aplicadas ao reconhecimento facial
Autor(a) principal: | |
---|---|
Data de Publicação: | 2018 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da UCS |
Texto Completo: | https://repositorio.ucs.br/11338/4771 |
Resumo: | O reconhecimento facial por computadores ainda é uma tarefa desafiadora. Sistemas de redes neurais buscam soluções para que a tarefa de reconhecimento seja cada vez mais uma realidade. Hoje, as redes neurais convolucionais alcançam os resultados mais precisos se comparado a outros modelos de redes neurais. As redes neurais convolucionais são bem adaptadas para a classificação de imagens, porque se utilizam da estrutura espacial da imagem para realizar a análise. Por conta disso, redes neurais convolucionais e algumas variantes próximas são as mais utilizadas no reconhecimento de faces e imagens em geral. Técnicas de aprendizado de máquina chamadas de deep learning são aplicadas em conjunto com as redes neurais artificiais na tarefa de reconhecimento. O aprendizado de máquina realiza a busca de padrões nas imagens. O resultado da busca é aquisição de conhecimento, o que possibilita a adaptação necessária da rede neural para realizar o reconhecimento das imagens. A busca de padrões é feita através de treinamentos, que são realizados diversas vezes sobre uma base de dados com imagens de exemplo. Para o reconhecimento facial, o método de aprendizado mais utilizado é o aprendizado de máquina supervisionado. Nesse método a base de dados com imagens de exemplo já é previamente rotulada, indicando qual é a classe de cada imagem. A implementação de redes neurais artificiais e utilização de métodos de deep learning normalmente são feitos com o auxilio de frameworks. Existem frameworks open source voltados para a criação de redes neurais e aprendizado de máquina. Eles agilizam o processo de criação de sistemas de reconhecimento, já que criar um sistema de reconhecimento de imagens apartir do zero é algo complexo e demorado. Os frameworks possuem arquiteturas de redes neurais e métodos de aprendizado de máquina já implementados, deixando ao programador a tarefa de parametrização. No experimento apresentado nesse trabalho, foi realizado a identificação facial em tempo real de 10 pessoas. Utilizando 3 arquiteturas de rede neural diferentes, Inception V3, Inception V4 e Mobilenet V1 224. Todas as arquiteturas obtiveram as mesmas imagens de treinamento, 1149 fotos, que variou entre 74 e 160 fotos de cada um dos participantes. Na análise das imagens foi utilizado uma câmera de 13 Mpx, para a captura das imagens, e um equipamento Raspeberry para o processamento dos dados. A arquitetura Inception V4 não pode ser iniciada no equipamento Raspeberry, pois o mesmo não conseguiu carregá-la devido a pouco quantidade de memória RAM, 1 GB, e, portanto, os seus resultados não foram contabilizados. Quanto as demais, Inception V3 e Mobilenet V1 224, obtiveram resultados distintos em termos de acurácia e velocidade de processamento. A Inception V3 obteve uma maior acurácia, enquanto a Mobilenet V1 224 obteve a maior velocidade de processamento (sic). |
id |
UCS_fb77d27378202e977e7596a420bade12 |
---|---|
oai_identifier_str |
oai:repositorio.ucs.br:11338/4771 |
network_acronym_str |
UCS |
network_name_str |
Repositório Institucional da UCS |
repository_id_str |
|
spelling |
Chaves, Rodrigo ReuseLima, Maria de Fátima Webber do PradoMorales, Andréa CantarelliWebber, Carine Geltrudes2019-06-25T16:37:59Z2019-06-25T16:37:59Z2019-06-252018-12-13https://repositorio.ucs.br/11338/4771O reconhecimento facial por computadores ainda é uma tarefa desafiadora. Sistemas de redes neurais buscam soluções para que a tarefa de reconhecimento seja cada vez mais uma realidade. Hoje, as redes neurais convolucionais alcançam os resultados mais precisos se comparado a outros modelos de redes neurais. As redes neurais convolucionais são bem adaptadas para a classificação de imagens, porque se utilizam da estrutura espacial da imagem para realizar a análise. Por conta disso, redes neurais convolucionais e algumas variantes próximas são as mais utilizadas no reconhecimento de faces e imagens em geral. Técnicas de aprendizado de máquina chamadas de deep learning são aplicadas em conjunto com as redes neurais artificiais na tarefa de reconhecimento. O aprendizado de máquina realiza a busca de padrões nas imagens. O resultado da busca é aquisição de conhecimento, o que possibilita a adaptação necessária da rede neural para realizar o reconhecimento das imagens. A busca de padrões é feita através de treinamentos, que são realizados diversas vezes sobre uma base de dados com imagens de exemplo. Para o reconhecimento facial, o método de aprendizado mais utilizado é o aprendizado de máquina supervisionado. Nesse método a base de dados com imagens de exemplo já é previamente rotulada, indicando qual é a classe de cada imagem. A implementação de redes neurais artificiais e utilização de métodos de deep learning normalmente são feitos com o auxilio de frameworks. Existem frameworks open source voltados para a criação de redes neurais e aprendizado de máquina. Eles agilizam o processo de criação de sistemas de reconhecimento, já que criar um sistema de reconhecimento de imagens apartir do zero é algo complexo e demorado. Os frameworks possuem arquiteturas de redes neurais e métodos de aprendizado de máquina já implementados, deixando ao programador a tarefa de parametrização. No experimento apresentado nesse trabalho, foi realizado a identificação facial em tempo real de 10 pessoas. Utilizando 3 arquiteturas de rede neural diferentes, Inception V3, Inception V4 e Mobilenet V1 224. Todas as arquiteturas obtiveram as mesmas imagens de treinamento, 1149 fotos, que variou entre 74 e 160 fotos de cada um dos participantes. Na análise das imagens foi utilizado uma câmera de 13 Mpx, para a captura das imagens, e um equipamento Raspeberry para o processamento dos dados. A arquitetura Inception V4 não pode ser iniciada no equipamento Raspeberry, pois o mesmo não conseguiu carregá-la devido a pouco quantidade de memória RAM, 1 GB, e, portanto, os seus resultados não foram contabilizados. Quanto as demais, Inception V3 e Mobilenet V1 224, obtiveram resultados distintos em termos de acurácia e velocidade de processamento. A Inception V3 obteve uma maior acurácia, enquanto a Mobilenet V1 224 obteve a maior velocidade de processamento (sic).Inteligência artificialRedes neurais (Computação)Percepção facialRedes neurais deep learning aplicadas ao reconhecimento facialinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisporreponame:Repositório Institucional da UCSinstname:Universidade de Caxias do Sul (UCS)instacron:UCSinfo:eu-repo/semantics/openAccessUniversidade de Caxias do SulBacharelado em Ciência da ComputaçãoTHUMBNAILTCC Rodrigo Reuse Chaves.pdf.jpgTCC Rodrigo Reuse Chaves.pdf.jpgGenerated Thumbnailimage/jpeg1281https://repositorio.ucs.br/xmlui/bitstream/11338/4771/4/TCC%20Rodrigo%20Reuse%20Chaves.pdf.jpgf7d60a964226779ea9eca443d4d7429bMD54ORIGINALTCC Rodrigo Reuse Chaves.pdfTCC Rodrigo Reuse Chaves.pdfapplication/pdf2465114https://repositorio.ucs.br/xmlui/bitstream/11338/4771/1/TCC%20Rodrigo%20Reuse%20Chaves.pdf3cd8c0db4789119589f37035cdb06c11MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-8510https://repositorio.ucs.br/xmlui/bitstream/11338/4771/2/license.txt0bfdaf5679b458f1c173109e3e8d8e40MD52TEXTTCC Rodrigo Reuse Chaves.pdf.txtTCC Rodrigo Reuse Chaves.pdf.txtExtracted texttext/plain112822https://repositorio.ucs.br/xmlui/bitstream/11338/4771/3/TCC%20Rodrigo%20Reuse%20Chaves.pdf.txtf0941cd54349ee96917fcded6ec87004MD5311338/47712020-04-29 15:17:33.54oai:repositorio.ucs.br:11338/4771Repositório de Publicaçõeshttp://repositorio.ucs.br/oai/requestopendoar:2024-05-06T10:04:54.570174Repositório Institucional da UCS - Universidade de Caxias do Sul (UCS)false |
dc.title.pt_BR.fl_str_mv |
Redes neurais deep learning aplicadas ao reconhecimento facial |
title |
Redes neurais deep learning aplicadas ao reconhecimento facial |
spellingShingle |
Redes neurais deep learning aplicadas ao reconhecimento facial Chaves, Rodrigo Reuse Inteligência artificial Redes neurais (Computação) Percepção facial |
title_short |
Redes neurais deep learning aplicadas ao reconhecimento facial |
title_full |
Redes neurais deep learning aplicadas ao reconhecimento facial |
title_fullStr |
Redes neurais deep learning aplicadas ao reconhecimento facial |
title_full_unstemmed |
Redes neurais deep learning aplicadas ao reconhecimento facial |
title_sort |
Redes neurais deep learning aplicadas ao reconhecimento facial |
author |
Chaves, Rodrigo Reuse |
author_facet |
Chaves, Rodrigo Reuse |
author_role |
author |
dc.contributor.other.none.fl_str_mv |
Lima, Maria de Fátima Webber do Prado Morales, Andréa Cantarelli |
dc.contributor.author.fl_str_mv |
Chaves, Rodrigo Reuse |
dc.contributor.advisor1.fl_str_mv |
Webber, Carine Geltrudes |
contributor_str_mv |
Webber, Carine Geltrudes |
dc.subject.por.fl_str_mv |
Inteligência artificial Redes neurais (Computação) Percepção facial |
topic |
Inteligência artificial Redes neurais (Computação) Percepção facial |
description |
O reconhecimento facial por computadores ainda é uma tarefa desafiadora. Sistemas de redes neurais buscam soluções para que a tarefa de reconhecimento seja cada vez mais uma realidade. Hoje, as redes neurais convolucionais alcançam os resultados mais precisos se comparado a outros modelos de redes neurais. As redes neurais convolucionais são bem adaptadas para a classificação de imagens, porque se utilizam da estrutura espacial da imagem para realizar a análise. Por conta disso, redes neurais convolucionais e algumas variantes próximas são as mais utilizadas no reconhecimento de faces e imagens em geral. Técnicas de aprendizado de máquina chamadas de deep learning são aplicadas em conjunto com as redes neurais artificiais na tarefa de reconhecimento. O aprendizado de máquina realiza a busca de padrões nas imagens. O resultado da busca é aquisição de conhecimento, o que possibilita a adaptação necessária da rede neural para realizar o reconhecimento das imagens. A busca de padrões é feita através de treinamentos, que são realizados diversas vezes sobre uma base de dados com imagens de exemplo. Para o reconhecimento facial, o método de aprendizado mais utilizado é o aprendizado de máquina supervisionado. Nesse método a base de dados com imagens de exemplo já é previamente rotulada, indicando qual é a classe de cada imagem. A implementação de redes neurais artificiais e utilização de métodos de deep learning normalmente são feitos com o auxilio de frameworks. Existem frameworks open source voltados para a criação de redes neurais e aprendizado de máquina. Eles agilizam o processo de criação de sistemas de reconhecimento, já que criar um sistema de reconhecimento de imagens apartir do zero é algo complexo e demorado. Os frameworks possuem arquiteturas de redes neurais e métodos de aprendizado de máquina já implementados, deixando ao programador a tarefa de parametrização. No experimento apresentado nesse trabalho, foi realizado a identificação facial em tempo real de 10 pessoas. Utilizando 3 arquiteturas de rede neural diferentes, Inception V3, Inception V4 e Mobilenet V1 224. Todas as arquiteturas obtiveram as mesmas imagens de treinamento, 1149 fotos, que variou entre 74 e 160 fotos de cada um dos participantes. Na análise das imagens foi utilizado uma câmera de 13 Mpx, para a captura das imagens, e um equipamento Raspeberry para o processamento dos dados. A arquitetura Inception V4 não pode ser iniciada no equipamento Raspeberry, pois o mesmo não conseguiu carregá-la devido a pouco quantidade de memória RAM, 1 GB, e, portanto, os seus resultados não foram contabilizados. Quanto as demais, Inception V3 e Mobilenet V1 224, obtiveram resultados distintos em termos de acurácia e velocidade de processamento. A Inception V3 obteve uma maior acurácia, enquanto a Mobilenet V1 224 obteve a maior velocidade de processamento (sic). |
publishDate |
2018 |
dc.date.submitted.none.fl_str_mv |
2018-12-13 |
dc.date.accessioned.fl_str_mv |
2019-06-25T16:37:59Z |
dc.date.available.fl_str_mv |
2019-06-25T16:37:59Z |
dc.date.issued.fl_str_mv |
2019-06-25 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://repositorio.ucs.br/11338/4771 |
url |
https://repositorio.ucs.br/11338/4771 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UCS instname:Universidade de Caxias do Sul (UCS) instacron:UCS |
instname_str |
Universidade de Caxias do Sul (UCS) |
instacron_str |
UCS |
institution |
UCS |
reponame_str |
Repositório Institucional da UCS |
collection |
Repositório Institucional da UCS |
bitstream.url.fl_str_mv |
https://repositorio.ucs.br/xmlui/bitstream/11338/4771/4/TCC%20Rodrigo%20Reuse%20Chaves.pdf.jpg https://repositorio.ucs.br/xmlui/bitstream/11338/4771/1/TCC%20Rodrigo%20Reuse%20Chaves.pdf https://repositorio.ucs.br/xmlui/bitstream/11338/4771/2/license.txt https://repositorio.ucs.br/xmlui/bitstream/11338/4771/3/TCC%20Rodrigo%20Reuse%20Chaves.pdf.txt |
bitstream.checksum.fl_str_mv |
f7d60a964226779ea9eca443d4d7429b 3cd8c0db4789119589f37035cdb06c11 0bfdaf5679b458f1c173109e3e8d8e40 f0941cd54349ee96917fcded6ec87004 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UCS - Universidade de Caxias do Sul (UCS) |
repository.mail.fl_str_mv |
|
_version_ |
1813258451683377152 |