Redes neurais deep learning aplicadas ao reconhecimento facial

Chaves, Rodrigo Reuse

Redes neurais deep learning aplicadas ao reconhecimento facial

Detalhes bibliográficos
Autor(a) principal:	Chaves, Rodrigo Reuse
Data de Publicação:	2018
Tipo de documento:	Trabalho de conclusão de curso
Idioma:	por
Título da fonte:	Repositório Institucional da UCS
Texto Completo:	https://repositorio.ucs.br/11338/4771
Resumo:	O reconhecimento facial por computadores ainda é uma tarefa desafiadora. Sistemas de redes neurais buscam soluções para que a tarefa de reconhecimento seja cada vez mais uma realidade. Hoje, as redes neurais convolucionais alcançam os resultados mais precisos se comparado a outros modelos de redes neurais. As redes neurais convolucionais são bem adaptadas para a classificação de imagens, porque se utilizam da estrutura espacial da imagem para realizar a análise. Por conta disso, redes neurais convolucionais e algumas variantes próximas são as mais utilizadas no reconhecimento de faces e imagens em geral. Técnicas de aprendizado de máquina chamadas de deep learning são aplicadas em conjunto com as redes neurais artificiais na tarefa de reconhecimento. O aprendizado de máquina realiza a busca de padrões nas imagens. O resultado da busca é aquisição de conhecimento, o que possibilita a adaptação necessária da rede neural para realizar o reconhecimento das imagens. A busca de padrões é feita através de treinamentos, que são realizados diversas vezes sobre uma base de dados com imagens de exemplo. Para o reconhecimento facial, o método de aprendizado mais utilizado é o aprendizado de máquina supervisionado. Nesse método a base de dados com imagens de exemplo já é previamente rotulada, indicando qual é a classe de cada imagem. A implementação de redes neurais artificiais e utilização de métodos de deep learning normalmente são feitos com o auxilio de frameworks. Existem frameworks open source voltados para a criação de redes neurais e aprendizado de máquina. Eles agilizam o processo de criação de sistemas de reconhecimento, já que criar um sistema de reconhecimento de imagens apartir do zero é algo complexo e demorado. Os frameworks possuem arquiteturas de redes neurais e métodos de aprendizado de máquina já implementados, deixando ao programador a tarefa de parametrização. No experimento apresentado nesse trabalho, foi realizado a identificação facial em tempo real de 10 pessoas. Utilizando 3 arquiteturas de rede neural diferentes, Inception V3, Inception V4 e Mobilenet V1 224. Todas as arquiteturas obtiveram as mesmas imagens de treinamento, 1149 fotos, que variou entre 74 e 160 fotos de cada um dos participantes. Na análise das imagens foi utilizado uma câmera de 13 Mpx, para a captura das imagens, e um equipamento Raspeberry para o processamento dos dados. A arquitetura Inception V4 não pode ser iniciada no equipamento Raspeberry, pois o mesmo não conseguiu carregá-la devido a pouco quantidade de memória RAM, 1 GB, e, portanto, os seus resultados não foram contabilizados. Quanto as demais, Inception V3 e Mobilenet V1 224, obtiveram resultados distintos em termos de acurácia e velocidade de processamento. A Inception V3 obteve uma maior acurácia, enquanto a Mobilenet V1 224 obteve a maior velocidade de processamento (sic).

Metadados do item

id	UCS_fb77d27378202e977e7596a420bade12
oai_identifier_str	oai:repositorio.ucs.br:11338/4771
network_acronym_str	UCS
network_name_str	Repositório Institucional da UCS
repository_id_str
spelling	Chaves, Rodrigo ReuseLima, Maria de Fátima Webber do PradoMorales, Andréa CantarelliWebber, Carine Geltrudes2019-06-25T16:37:59Z2019-06-25T16:37:59Z2019-06-252018-12-13https://repositorio.ucs.br/11338/4771O reconhecimento facial por computadores ainda é uma tarefa desafiadora. Sistemas de redes neurais buscam soluções para que a tarefa de reconhecimento seja cada vez mais uma realidade. Hoje, as redes neurais convolucionais alcançam os resultados mais precisos se comparado a outros modelos de redes neurais. As redes neurais convolucionais são bem adaptadas para a classificação de imagens, porque se utilizam da estrutura espacial da imagem para realizar a análise. Por conta disso, redes neurais convolucionais e algumas variantes próximas são as mais utilizadas no reconhecimento de faces e imagens em geral. Técnicas de aprendizado de máquina chamadas de deep learning são aplicadas em conjunto com as redes neurais artificiais na tarefa de reconhecimento. O aprendizado de máquina realiza a busca de padrões nas imagens. O resultado da busca é aquisição de conhecimento, o que possibilita a adaptação necessária da rede neural para realizar o reconhecimento das imagens. A busca de padrões é feita através de treinamentos, que são realizados diversas vezes sobre uma base de dados com imagens de exemplo. Para o reconhecimento facial, o método de aprendizado mais utilizado é o aprendizado de máquina supervisionado. Nesse método a base de dados com imagens de exemplo já é previamente rotulada, indicando qual é a classe de cada imagem. A implementação de redes neurais artificiais e utilização de métodos de deep learning normalmente são feitos com o auxilio de frameworks. Existem frameworks open source voltados para a criação de redes neurais e aprendizado de máquina. Eles agilizam o processo de criação de sistemas de reconhecimento, já que criar um sistema de reconhecimento de imagens apartir do zero é algo complexo e demorado. Os frameworks possuem arquiteturas de redes neurais e métodos de aprendizado de máquina já implementados, deixando ao programador a tarefa de parametrização. No experimento apresentado nesse trabalho, foi realizado a identificação facial em tempo real de 10 pessoas. Utilizando 3 arquiteturas de rede neural diferentes, Inception V3, Inception V4 e Mobilenet V1 224. Todas as arquiteturas obtiveram as mesmas imagens de treinamento, 1149 fotos, que variou entre 74 e 160 fotos de cada um dos participantes. Na análise das imagens foi utilizado uma câmera de 13 Mpx, para a captura das imagens, e um equipamento Raspeberry para o processamento dos dados. A arquitetura Inception V4 não pode ser iniciada no equipamento Raspeberry, pois o mesmo não conseguiu carregá-la devido a pouco quantidade de memória RAM, 1 GB, e, portanto, os seus resultados não foram contabilizados. Quanto as demais, Inception V3 e Mobilenet V1 224, obtiveram resultados distintos em termos de acurácia e velocidade de processamento. A Inception V3 obteve uma maior acurácia, enquanto a Mobilenet V1 224 obteve a maior velocidade de processamento (sic).Inteligência artificialRedes neurais (Computação)Percepção facialRedes neurais deep learning aplicadas ao reconhecimento facialinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisporreponame:Repositório Institucional da UCSinstname:Universidade de Caxias do Sul (UCS)instacron:UCSinfo:eu-repo/semantics/openAccessUniversidade de Caxias do SulBacharelado em Ciência da ComputaçãoTHUMBNAILTCC Rodrigo Reuse Chaves.pdf.jpgTCC Rodrigo Reuse Chaves.pdf.jpgGenerated Thumbnailimage/jpeg1281https://repositorio.ucs.br/xmlui/bitstream/11338/4771/4/TCC%20Rodrigo%20Reuse%20Chaves.pdf.jpgf7d60a964226779ea9eca443d4d7429bMD54ORIGINALTCC Rodrigo Reuse Chaves.pdfTCC Rodrigo Reuse Chaves.pdfapplication/pdf2465114https://repositorio.ucs.br/xmlui/bitstream/11338/4771/1/TCC%20Rodrigo%20Reuse%20Chaves.pdf3cd8c0db4789119589f37035cdb06c11MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-8510https://repositorio.ucs.br/xmlui/bitstream/11338/4771/2/license.txt0bfdaf5679b458f1c173109e3e8d8e40MD52TEXTTCC Rodrigo Reuse Chaves.pdf.txtTCC Rodrigo Reuse Chaves.pdf.txtExtracted texttext/plain112822https://repositorio.ucs.br/xmlui/bitstream/11338/4771/3/TCC%20Rodrigo%20Reuse%20Chaves.pdf.txtf0941cd54349ee96917fcded6ec87004MD5311338/47712020-04-29 15:17:33.54oai:repositorio.ucs.br:11338/4771Repositório de Publicaçõeshttp://repositorio.ucs.br/oai/requestopendoar:2020-04-29T15:17:33Repositório Institucional da UCS - Universidade de Caxias do Sul (UCS)false
dc.title.pt_BR.fl_str_mv	Redes neurais deep learning aplicadas ao reconhecimento facial
title	Redes neurais deep learning aplicadas ao reconhecimento facial
spellingShingle	Redes neurais deep learning aplicadas ao reconhecimento facial Chaves, Rodrigo Reuse Inteligência artificial Redes neurais (Computação) Percepção facial
title_short	Redes neurais deep learning aplicadas ao reconhecimento facial
title_full	Redes neurais deep learning aplicadas ao reconhecimento facial
title_fullStr	Redes neurais deep learning aplicadas ao reconhecimento facial
title_full_unstemmed	Redes neurais deep learning aplicadas ao reconhecimento facial
title_sort	Redes neurais deep learning aplicadas ao reconhecimento facial
author	Chaves, Rodrigo Reuse
author_facet	Chaves, Rodrigo Reuse
author_role	author
dc.contributor.other.none.fl_str_mv	Lima, Maria de Fátima Webber do Prado Morales, Andréa Cantarelli
dc.contributor.author.fl_str_mv	Chaves, Rodrigo Reuse
dc.contributor.advisor1.fl_str_mv	Webber, Carine Geltrudes
contributor_str_mv	Webber, Carine Geltrudes
dc.subject.por.fl_str_mv	Inteligência artificial Redes neurais (Computação) Percepção facial
topic	Inteligência artificial Redes neurais (Computação) Percepção facial
description	O reconhecimento facial por computadores ainda é uma tarefa desafiadora. Sistemas de redes neurais buscam soluções para que a tarefa de reconhecimento seja cada vez mais uma realidade. Hoje, as redes neurais convolucionais alcançam os resultados mais precisos se comparado a outros modelos de redes neurais. As redes neurais convolucionais são bem adaptadas para a classificação de imagens, porque se utilizam da estrutura espacial da imagem para realizar a análise. Por conta disso, redes neurais convolucionais e algumas variantes próximas são as mais utilizadas no reconhecimento de faces e imagens em geral. Técnicas de aprendizado de máquina chamadas de deep learning são aplicadas em conjunto com as redes neurais artificiais na tarefa de reconhecimento. O aprendizado de máquina realiza a busca de padrões nas imagens. O resultado da busca é aquisição de conhecimento, o que possibilita a adaptação necessária da rede neural para realizar o reconhecimento das imagens. A busca de padrões é feita através de treinamentos, que são realizados diversas vezes sobre uma base de dados com imagens de exemplo. Para o reconhecimento facial, o método de aprendizado mais utilizado é o aprendizado de máquina supervisionado. Nesse método a base de dados com imagens de exemplo já é previamente rotulada, indicando qual é a classe de cada imagem. A implementação de redes neurais artificiais e utilização de métodos de deep learning normalmente são feitos com o auxilio de frameworks. Existem frameworks open source voltados para a criação de redes neurais e aprendizado de máquina. Eles agilizam o processo de criação de sistemas de reconhecimento, já que criar um sistema de reconhecimento de imagens apartir do zero é algo complexo e demorado. Os frameworks possuem arquiteturas de redes neurais e métodos de aprendizado de máquina já implementados, deixando ao programador a tarefa de parametrização. No experimento apresentado nesse trabalho, foi realizado a identificação facial em tempo real de 10 pessoas. Utilizando 3 arquiteturas de rede neural diferentes, Inception V3, Inception V4 e Mobilenet V1 224. Todas as arquiteturas obtiveram as mesmas imagens de treinamento, 1149 fotos, que variou entre 74 e 160 fotos de cada um dos participantes. Na análise das imagens foi utilizado uma câmera de 13 Mpx, para a captura das imagens, e um equipamento Raspeberry para o processamento dos dados. A arquitetura Inception V4 não pode ser iniciada no equipamento Raspeberry, pois o mesmo não conseguiu carregá-la devido a pouco quantidade de memória RAM, 1 GB, e, portanto, os seus resultados não foram contabilizados. Quanto as demais, Inception V3 e Mobilenet V1 224, obtiveram resultados distintos em termos de acurácia e velocidade de processamento. A Inception V3 obteve uma maior acurácia, enquanto a Mobilenet V1 224 obteve a maior velocidade de processamento (sic).
publishDate	2018
dc.date.submitted.none.fl_str_mv	2018-12-13
dc.date.accessioned.fl_str_mv	2019-06-25T16:37:59Z
dc.date.available.fl_str_mv	2019-06-25T16:37:59Z
dc.date.issued.fl_str_mv	2019-06-25
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/bachelorThesis
format	bachelorThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	https://repositorio.ucs.br/11338/4771
url	https://repositorio.ucs.br/11338/4771
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.source.none.fl_str_mv	reponame:Repositório Institucional da UCS instname:Universidade de Caxias do Sul (UCS) instacron:UCS
instname_str	Universidade de Caxias do Sul (UCS)
instacron_str	UCS
institution	UCS
reponame_str	Repositório Institucional da UCS
collection	Repositório Institucional da UCS
bitstream.url.fl_str_mv	https://repositorio.ucs.br/xmlui/bitstream/11338/4771/4/TCC%20Rodrigo%20Reuse%20Chaves.pdf.jpg https://repositorio.ucs.br/xmlui/bitstream/11338/4771/1/TCC%20Rodrigo%20Reuse%20Chaves.pdf https://repositorio.ucs.br/xmlui/bitstream/11338/4771/2/license.txt https://repositorio.ucs.br/xmlui/bitstream/11338/4771/3/TCC%20Rodrigo%20Reuse%20Chaves.pdf.txt
bitstream.checksum.fl_str_mv	f7d60a964226779ea9eca443d4d7429b 3cd8c0db4789119589f37035cdb06c11 0bfdaf5679b458f1c173109e3e8d8e40 f0941cd54349ee96917fcded6ec87004
bitstream.checksumAlgorithm.fl_str_mv	MD5 MD5 MD5 MD5
repository.name.fl_str_mv	Repositório Institucional da UCS - Universidade de Caxias do Sul (UCS)
repository.mail.fl_str_mv
_version_	1798308905894281216

Redes neurais deep learning aplicadas ao reconhecimento facial

Registros relacionados