Contributions in face detection with deep neural networks

Detalhes bibliográficos
Autor(a) principal: Paula, Thomas da Silva
Data de Publicação: 2017
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Biblioteca Digital de Teses e Dissertações da PUC_RS
Texto Completo: http://tede2.pucrs.br/tede2/handle/tede/7563
Resumo: Reconhecimento facial é um dos assuntos mais estudos no campo de Visão Computacional. Dada uma imagem arbitrária ou um frame arbitrário, o objetivo do reconhecimento facial é determinar se existem faces na imagem e, se existirem, obter a localização e a extensão de cada face encontrada. Tal detecção é facilmente feita por seres humanos, porém continua sendo um desafio em Visão Computacional. O alto grau de variabilidade e a dinamicidade da face humana tornam-a difícil de detectar, principalmente em ambientes complexos. Recentementemente, abordagens de Aprendizado Profundo começaram a ser utilizadas em tarefas de Visão Computacional com bons resultados. Tais resultados abriram novas possibilidades de pesquisa em diferentes aplicações, incluindo Reconhecimento Facial. Embora abordagens de Aprendizado Profundo tenham sido aplicadas com sucesso para tal tarefa, a maior parte das implementações estado da arte utilizam detectores faciais off-the-shelf e não avaliam as diferenças entre eles. Em outros casos, os detectores faciais são treinados para múltiplas tarefas, como detecção de pontos fiduciais, detecção de idade, entre outros. Portanto, nós temos três principais objetivos. Primeiramente, nós resumimos e explicamos alguns avanços do Aprendizado Profundo, detalhando como cada arquitetura e implementação funcionam. Depois, focamos no problema de detecção facial em si, realizando uma rigorosa análise de alguns dos detectores existentes assim como algumas implementações nossas. Nós experimentamos e avaliamos variações de alguns hiper-parâmetros para cada um dos detectores e seu impacto em diferentes bases de dados. Nós exploramos tanto implementações tradicionais quanto mais recentes, além de implementarmos nosso próprio detector facial. Por fim, nós implementamos, testamos e comparamos uma abordagem de meta-aprendizado para detecção facial, que visa aprender qual o melhor detector facial para uma determinada imagem. Nossos experimentos contribuem para o entendimento do papel do Aprendizado Profundo em detecção facial, assim como os detalhes relacionados a mudança de hiper-parâmetros dos detectores faciais e seu impacto no resultado da detecção facial. Nós também mostramos o quão bem features obtidas com redes neurais profundas — treinadas em bases de dados de propósito geral – combinadas com uma abordagem de meta-aprendizado, se aplicam a detecção facial. Nossos experimentos e conclusões mostram que o aprendizado profundo possui de fato um papel notável em detecção facial.
id P_RS_87e75e2f263e9adfff9aa3238f104945
oai_identifier_str oai:tede2.pucrs.br:tede/7563
network_acronym_str P_RS
network_name_str Biblioteca Digital de Teses e Dissertações da PUC_RS
repository_id_str
spelling Barros, Rodrigo Coelho008.272.080-06http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4526709Y3028.953.090-35Paula, Thomas da Silva2017-07-04T12:23:44Z2017-03-28http://tede2.pucrs.br/tede2/handle/tede/7563Reconhecimento facial é um dos assuntos mais estudos no campo de Visão Computacional. Dada uma imagem arbitrária ou um frame arbitrário, o objetivo do reconhecimento facial é determinar se existem faces na imagem e, se existirem, obter a localização e a extensão de cada face encontrada. Tal detecção é facilmente feita por seres humanos, porém continua sendo um desafio em Visão Computacional. O alto grau de variabilidade e a dinamicidade da face humana tornam-a difícil de detectar, principalmente em ambientes complexos. Recentementemente, abordagens de Aprendizado Profundo começaram a ser utilizadas em tarefas de Visão Computacional com bons resultados. Tais resultados abriram novas possibilidades de pesquisa em diferentes aplicações, incluindo Reconhecimento Facial. Embora abordagens de Aprendizado Profundo tenham sido aplicadas com sucesso para tal tarefa, a maior parte das implementações estado da arte utilizam detectores faciais off-the-shelf e não avaliam as diferenças entre eles. Em outros casos, os detectores faciais são treinados para múltiplas tarefas, como detecção de pontos fiduciais, detecção de idade, entre outros. Portanto, nós temos três principais objetivos. Primeiramente, nós resumimos e explicamos alguns avanços do Aprendizado Profundo, detalhando como cada arquitetura e implementação funcionam. Depois, focamos no problema de detecção facial em si, realizando uma rigorosa análise de alguns dos detectores existentes assim como algumas implementações nossas. Nós experimentamos e avaliamos variações de alguns hiper-parâmetros para cada um dos detectores e seu impacto em diferentes bases de dados. Nós exploramos tanto implementações tradicionais quanto mais recentes, além de implementarmos nosso próprio detector facial. Por fim, nós implementamos, testamos e comparamos uma abordagem de meta-aprendizado para detecção facial, que visa aprender qual o melhor detector facial para uma determinada imagem. Nossos experimentos contribuem para o entendimento do papel do Aprendizado Profundo em detecção facial, assim como os detalhes relacionados a mudança de hiper-parâmetros dos detectores faciais e seu impacto no resultado da detecção facial. Nós também mostramos o quão bem features obtidas com redes neurais profundas — treinadas em bases de dados de propósito geral – combinadas com uma abordagem de meta-aprendizado, se aplicam a detecção facial. Nossos experimentos e conclusões mostram que o aprendizado profundo possui de fato um papel notável em detecção facial.Face Detection is one of the most studied subjects in the Computer Vision field. Given an arbitrary image or video frame, the goal of face detection is to determine whether there are any faces in the image and, if present, return the image location and the extent of each face. Such a detection is easily done by humans, but it is still a challenge within Computer Vision. The high degree of variability and the dynamicity of the human face makes it an object very difficult to detect, mainly in complex environments. Recently, Deep Learning approaches started to be applied for Computer Vision tasks with great results. They opened new research possibilities in different applications, including Face Detection. Even though Deep Learning has been successfully applied for such a task, most of the state-of-the-art implementations make use of off-the-shelf face detectors and do not evaluate differences among them. In other cases, the face detectors are trained in a multitask manner that includes face landmark detection, age detection, and so on. Hence, our goal is threefold. First, we summarize and explain many advances of deep learning, detailing how each different architecture and implementation work. Second, we focus on the face detection problem itself, performing a rigorous analysis of some of the existing face detectors as well as implementations of our own. We experiment and evaluate variations of hyper-parameters for each of the detectors and their impact in different datasets. We explore both traditional and more recent approaches, as well as implementing our own face detectors. Finally, we implement, test, and compare a meta learning approach for face detection, which aims to learn the best face detector for a given image. Our experiments contribute in understanding the role of deep learning in face detection as well as the subtleties of changing hyper-parameters of the face detectors and their impact in face detection. We also show how well features obtained with deep neural networks trained on a general-purpose dataset perform on a meta learning approach for face detection. Our experiments and conclusions show that deep learning has indeed a notable role in face detection.Submitted by Caroline Xavier (caroline.xavier@pucrs.br) on 2017-07-04T12:23:43Z No. of bitstreams: 1 DIS_THOMAS_DA_SILVA_PAULA_COMPLETO.pdf: 10601063 bytes, checksum: f63f9b6e33e22c4a2553f784a3a029e1 (MD5)Made available in DSpace on 2017-07-04T12:23:44Z (GMT). No. of bitstreams: 1 DIS_THOMAS_DA_SILVA_PAULA_COMPLETO.pdf: 10601063 bytes, checksum: f63f9b6e33e22c4a2553f784a3a029e1 (MD5) Previous issue date: 2017-03-28application/pdfhttp://tede2.pucrs.br:80/tede2/retrieve/169402/DIS_THOMAS_DA_SILVA_PAULA_COMPLETO.pdf.jpgengPontifícia Universidade Católica do Rio Grande do SulPrograma de Pós-Graduação em Ciência da ComputaçãoPUCRSBrasilFaculdade de InformáticaDeep LearningFace DetectionNeural NetworksMachine LearningComputer VisionAprendizado ProfundoReconhecimento FacialRedes NeuraisAprendizado de MáquinaVisão ComputacionalCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOContributions in face detection with deep neural networksinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis1974996533081274470600600600-30085425104011491443671711205811204509info:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da PUC_RSinstname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)instacron:PUC_RSTHUMBNAILDIS_THOMAS_DA_SILVA_PAULA_COMPLETO.pdf.jpgDIS_THOMAS_DA_SILVA_PAULA_COMPLETO.pdf.jpgimage/jpeg3504http://tede2.pucrs.br/tede2/bitstream/tede/7563/4/DIS_THOMAS_DA_SILVA_PAULA_COMPLETO.pdf.jpg74fd6fd0cfd81684dc4b4e0c28a106e3MD54TEXTDIS_THOMAS_DA_SILVA_PAULA_COMPLETO.pdf.txtDIS_THOMAS_DA_SILVA_PAULA_COMPLETO.pdf.txttext/plain292558http://tede2.pucrs.br/tede2/bitstream/tede/7563/3/DIS_THOMAS_DA_SILVA_PAULA_COMPLETO.pdf.txtc92f367349945c0920b03031e8ae4e15MD53ORIGINALDIS_THOMAS_DA_SILVA_PAULA_COMPLETO.pdfDIS_THOMAS_DA_SILVA_PAULA_COMPLETO.pdfapplication/pdf10601063http://tede2.pucrs.br/tede2/bitstream/tede/7563/2/DIS_THOMAS_DA_SILVA_PAULA_COMPLETO.pdff63f9b6e33e22c4a2553f784a3a029e1MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-8610http://tede2.pucrs.br/tede2/bitstream/tede/7563/1/license.txt5a9d6006225b368ef605ba16b4f6d1beMD51tede/75632017-07-04 12:00:30.386oai:tede2.pucrs.br:tede/7563QXV0b3JpemHDp8OjbyBwYXJhIFB1YmxpY2HDp8OjbyBFbGV0csO0bmljYTogQ29tIGJhc2Ugbm8gZGlzcG9zdG8gbmEgTGVpIEZlZGVyYWwgbsK6OS42MTAsIGRlIDE5IGRlIGZldmVyZWlybyBkZSAxOTk4LCBvIGF1dG9yIEFVVE9SSVpBIGEgcHVibGljYcOnw6NvIGVsZXRyw7RuaWNhIGRhIHByZXNlbnRlIG9icmEgbm8gYWNlcnZvIGRhIEJpYmxpb3RlY2EgRGlnaXRhbCBkYSBQb250aWbDrWNpYSBVbml2ZXJzaWRhZGUgQ2F0w7NsaWNhIGRvIFJpbyBHcmFuZGUgZG8gU3VsLCBzZWRpYWRhIGEgQXYuIElwaXJhbmdhIDY2ODEsIFBvcnRvIEFsZWdyZSwgUmlvIEdyYW5kZSBkbyBTdWwsIGNvbSByZWdpc3RybyBkZSBDTlBKIDg4NjMwNDEzMDAwMi04MSBiZW0gY29tbyBlbSBvdXRyYXMgYmlibGlvdGVjYXMgZGlnaXRhaXMsIG5hY2lvbmFpcyBlIGludGVybmFjaW9uYWlzLCBjb25zw7NyY2lvcyBlIHJlZGVzIMOgcyBxdWFpcyBhIGJpYmxpb3RlY2EgZGEgUFVDUlMgcG9zc2EgYSB2aXIgcGFydGljaXBhciwgc2VtIMO0bnVzIGFsdXNpdm8gYW9zIGRpcmVpdG9zIGF1dG9yYWlzLCBhIHTDrXR1bG8gZGUgZGl2dWxnYcOnw6NvIGRhIHByb2R1w6fDo28gY2llbnTDrWZpY2EuCg==Biblioteca Digital de Teses e Dissertaçõeshttp://tede2.pucrs.br/tede2/PRIhttps://tede2.pucrs.br/oai/requestbiblioteca.central@pucrs.br||opendoar:2017-07-04T15:00:30Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)false
dc.title.por.fl_str_mv Contributions in face detection with deep neural networks
title Contributions in face detection with deep neural networks
spellingShingle Contributions in face detection with deep neural networks
Paula, Thomas da Silva
Deep Learning
Face Detection
Neural Networks
Machine Learning
Computer Vision
Aprendizado Profundo
Reconhecimento Facial
Redes Neurais
Aprendizado de Máquina
Visão Computacional
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
title_short Contributions in face detection with deep neural networks
title_full Contributions in face detection with deep neural networks
title_fullStr Contributions in face detection with deep neural networks
title_full_unstemmed Contributions in face detection with deep neural networks
title_sort Contributions in face detection with deep neural networks
author Paula, Thomas da Silva
author_facet Paula, Thomas da Silva
author_role author
dc.contributor.advisor1.fl_str_mv Barros, Rodrigo Coelho
dc.contributor.advisor1ID.fl_str_mv 008.272.080-06
dc.contributor.advisor1Lattes.fl_str_mv http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4526709Y3
dc.contributor.authorID.fl_str_mv 028.953.090-35
dc.contributor.author.fl_str_mv Paula, Thomas da Silva
contributor_str_mv Barros, Rodrigo Coelho
dc.subject.eng.fl_str_mv Deep Learning
Face Detection
Neural Networks
Machine Learning
Computer Vision
topic Deep Learning
Face Detection
Neural Networks
Machine Learning
Computer Vision
Aprendizado Profundo
Reconhecimento Facial
Redes Neurais
Aprendizado de Máquina
Visão Computacional
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
dc.subject.por.fl_str_mv Aprendizado Profundo
Reconhecimento Facial
Redes Neurais
Aprendizado de Máquina
Visão Computacional
dc.subject.cnpq.fl_str_mv CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
description Reconhecimento facial é um dos assuntos mais estudos no campo de Visão Computacional. Dada uma imagem arbitrária ou um frame arbitrário, o objetivo do reconhecimento facial é determinar se existem faces na imagem e, se existirem, obter a localização e a extensão de cada face encontrada. Tal detecção é facilmente feita por seres humanos, porém continua sendo um desafio em Visão Computacional. O alto grau de variabilidade e a dinamicidade da face humana tornam-a difícil de detectar, principalmente em ambientes complexos. Recentementemente, abordagens de Aprendizado Profundo começaram a ser utilizadas em tarefas de Visão Computacional com bons resultados. Tais resultados abriram novas possibilidades de pesquisa em diferentes aplicações, incluindo Reconhecimento Facial. Embora abordagens de Aprendizado Profundo tenham sido aplicadas com sucesso para tal tarefa, a maior parte das implementações estado da arte utilizam detectores faciais off-the-shelf e não avaliam as diferenças entre eles. Em outros casos, os detectores faciais são treinados para múltiplas tarefas, como detecção de pontos fiduciais, detecção de idade, entre outros. Portanto, nós temos três principais objetivos. Primeiramente, nós resumimos e explicamos alguns avanços do Aprendizado Profundo, detalhando como cada arquitetura e implementação funcionam. Depois, focamos no problema de detecção facial em si, realizando uma rigorosa análise de alguns dos detectores existentes assim como algumas implementações nossas. Nós experimentamos e avaliamos variações de alguns hiper-parâmetros para cada um dos detectores e seu impacto em diferentes bases de dados. Nós exploramos tanto implementações tradicionais quanto mais recentes, além de implementarmos nosso próprio detector facial. Por fim, nós implementamos, testamos e comparamos uma abordagem de meta-aprendizado para detecção facial, que visa aprender qual o melhor detector facial para uma determinada imagem. Nossos experimentos contribuem para o entendimento do papel do Aprendizado Profundo em detecção facial, assim como os detalhes relacionados a mudança de hiper-parâmetros dos detectores faciais e seu impacto no resultado da detecção facial. Nós também mostramos o quão bem features obtidas com redes neurais profundas — treinadas em bases de dados de propósito geral – combinadas com uma abordagem de meta-aprendizado, se aplicam a detecção facial. Nossos experimentos e conclusões mostram que o aprendizado profundo possui de fato um papel notável em detecção facial.
publishDate 2017
dc.date.accessioned.fl_str_mv 2017-07-04T12:23:44Z
dc.date.issued.fl_str_mv 2017-03-28
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://tede2.pucrs.br/tede2/handle/tede/7563
url http://tede2.pucrs.br/tede2/handle/tede/7563
dc.language.iso.fl_str_mv eng
language eng
dc.relation.program.fl_str_mv 1974996533081274470
dc.relation.confidence.fl_str_mv 600
600
600
dc.relation.department.fl_str_mv -3008542510401149144
dc.relation.cnpq.fl_str_mv 3671711205811204509
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Pontifícia Universidade Católica do Rio Grande do Sul
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Ciência da Computação
dc.publisher.initials.fl_str_mv PUCRS
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Faculdade de Informática
publisher.none.fl_str_mv Pontifícia Universidade Católica do Rio Grande do Sul
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da PUC_RS
instname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
instacron:PUC_RS
instname_str Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
instacron_str PUC_RS
institution PUC_RS
reponame_str Biblioteca Digital de Teses e Dissertações da PUC_RS
collection Biblioteca Digital de Teses e Dissertações da PUC_RS
bitstream.url.fl_str_mv http://tede2.pucrs.br/tede2/bitstream/tede/7563/4/DIS_THOMAS_DA_SILVA_PAULA_COMPLETO.pdf.jpg
http://tede2.pucrs.br/tede2/bitstream/tede/7563/3/DIS_THOMAS_DA_SILVA_PAULA_COMPLETO.pdf.txt
http://tede2.pucrs.br/tede2/bitstream/tede/7563/2/DIS_THOMAS_DA_SILVA_PAULA_COMPLETO.pdf
http://tede2.pucrs.br/tede2/bitstream/tede/7563/1/license.txt
bitstream.checksum.fl_str_mv 74fd6fd0cfd81684dc4b4e0c28a106e3
c92f367349945c0920b03031e8ae4e15
f63f9b6e33e22c4a2553f784a3a029e1
5a9d6006225b368ef605ba16b4f6d1be
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
repository.mail.fl_str_mv biblioteca.central@pucrs.br||
_version_ 1799765328114221056