ProShot: Assistente pessoal de fotografia

Detalhes bibliográficos
Autor(a) principal: Brosque, Pedro Miguel da Luz Cabrita de Sousa
Data de Publicação: 2018
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10071/18478
Resumo: Neste trabalho é proposta a criação de uma aplicação Android que sugere ao utilizador como melhorar a captura da fotografia, especificamente retratos de pessoas em tempo real, tendo por base a iluminação, o tipo de plano fotográfico presente e as características específicas para cada um, tal como o enquadramento. De forma a determinar qual o tipo de plano presente, é utilizada uma rede neuronal convolucional (CNN), sendo que para tal foram efetuados testes com várias redes diferentes e feita uma comparação para determinar que arquitetura se adequa melhor ao problema. A rede final atinge uma precisão de 99%, utilizando uma técnica de "transfer learning". Estes resultados foram obtidos num conjunto de imagens recolhidas e classificadas manualmente segundo cada tipo de plano fotográfico, tendo sido usado parte deste conjunto de dados no treino das próprias redes. Para determinar o enquadramento fotográfico, é proposto um método que utiliza um algoritmo de deteção facial seguido de um algoritmo de deteção de olhos que, com base na regra dos terços dá indicações ao utilizador sobre como corrigir o enquadramento. Foram comparados vários algoritmos de deteção facial tanto ao nível da eficácia de deteção como do tempo de processamento, onde a solução final assegura o equilíbrio entre os dois atingindo uma taxa de deteção de 91%. Foi também analisada a posição dos olhos num conjunto de imagens consideradas como tendo um bom enquadramento, as quais serviram para determinar um valor de tolerância que serviu como complemento para a regra dos terços.
id RCAP_9456389c817d73ef1240b1ca767a0a3d
oai_identifier_str oai:repositorio.iscte-iul.pt:10071/18478
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling ProShot: Assistente pessoal de fotografiaRedes neuronaisFotografia digitalProcessamento de imagensTelemóvelConvolutional neural networksImage processingFacial detectionEye detectionPhotographyReal-time detectionAndroidNeste trabalho é proposta a criação de uma aplicação Android que sugere ao utilizador como melhorar a captura da fotografia, especificamente retratos de pessoas em tempo real, tendo por base a iluminação, o tipo de plano fotográfico presente e as características específicas para cada um, tal como o enquadramento. De forma a determinar qual o tipo de plano presente, é utilizada uma rede neuronal convolucional (CNN), sendo que para tal foram efetuados testes com várias redes diferentes e feita uma comparação para determinar que arquitetura se adequa melhor ao problema. A rede final atinge uma precisão de 99%, utilizando uma técnica de "transfer learning". Estes resultados foram obtidos num conjunto de imagens recolhidas e classificadas manualmente segundo cada tipo de plano fotográfico, tendo sido usado parte deste conjunto de dados no treino das próprias redes. Para determinar o enquadramento fotográfico, é proposto um método que utiliza um algoritmo de deteção facial seguido de um algoritmo de deteção de olhos que, com base na regra dos terços dá indicações ao utilizador sobre como corrigir o enquadramento. Foram comparados vários algoritmos de deteção facial tanto ao nível da eficácia de deteção como do tempo de processamento, onde a solução final assegura o equilíbrio entre os dois atingindo uma taxa de deteção de 91%. Foi também analisada a posição dos olhos num conjunto de imagens consideradas como tendo um bom enquadramento, as quais serviram para determinar um valor de tolerância que serviu como complemento para a regra dos terços.In this work we propose the creation of an Android application that gives suggestions to the user on how to improve the capture of photography, specifically portraits in real time, based on lighting, the present type of photographic shot and their specific characteristics, such as framing. In order to determine what’s the present type of photographic shot, a convolutional neural network (CNN) is used. For this, tests were performed with several different networks and a comparison was made to determine which architecture best fits the problem. The final network obtains an accuracy of 99% using a transfer learning technique. These results were obtained on a data set of images, manually collected and classified according to each type of photographic shot, where part of this data set was also used in the training of the convolutional neural networks. To determine the photographic framing, we propose a method that uses a facial detection algorithm followed by an eye detection algorithm which, based on the rule of thirds, gives the user instructions on how to correct the framing. Several facial detection algorithms were compared in terms of detection effectiveness as well as processing time, where the final solution ensures a balance between the two reaching 91% of accuracy. The position of the eyes on a set of images considered as having a good framing was also analyzed, which helped to determine a tolerance value that served as a complement to the rule of thirds.2021-11-20T00:00:00Z2018-11-20T00:00:00Z2018-11-202018-10info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfapplication/octet-streamhttp://hdl.handle.net/10071/18478TID:202127443porBrosque, Pedro Miguel da Luz Cabrita de Sousainfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-11-09T17:38:42Zoai:repositorio.iscte-iul.pt:10071/18478Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T22:17:44.459480Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv ProShot: Assistente pessoal de fotografia
title ProShot: Assistente pessoal de fotografia
spellingShingle ProShot: Assistente pessoal de fotografia
Brosque, Pedro Miguel da Luz Cabrita de Sousa
Redes neuronais
Fotografia digital
Processamento de imagens
Telemóvel
Convolutional neural networks
Image processing
Facial detection
Eye detection
Photography
Real-time detection
Android
title_short ProShot: Assistente pessoal de fotografia
title_full ProShot: Assistente pessoal de fotografia
title_fullStr ProShot: Assistente pessoal de fotografia
title_full_unstemmed ProShot: Assistente pessoal de fotografia
title_sort ProShot: Assistente pessoal de fotografia
author Brosque, Pedro Miguel da Luz Cabrita de Sousa
author_facet Brosque, Pedro Miguel da Luz Cabrita de Sousa
author_role author
dc.contributor.author.fl_str_mv Brosque, Pedro Miguel da Luz Cabrita de Sousa
dc.subject.por.fl_str_mv Redes neuronais
Fotografia digital
Processamento de imagens
Telemóvel
Convolutional neural networks
Image processing
Facial detection
Eye detection
Photography
Real-time detection
Android
topic Redes neuronais
Fotografia digital
Processamento de imagens
Telemóvel
Convolutional neural networks
Image processing
Facial detection
Eye detection
Photography
Real-time detection
Android
description Neste trabalho é proposta a criação de uma aplicação Android que sugere ao utilizador como melhorar a captura da fotografia, especificamente retratos de pessoas em tempo real, tendo por base a iluminação, o tipo de plano fotográfico presente e as características específicas para cada um, tal como o enquadramento. De forma a determinar qual o tipo de plano presente, é utilizada uma rede neuronal convolucional (CNN), sendo que para tal foram efetuados testes com várias redes diferentes e feita uma comparação para determinar que arquitetura se adequa melhor ao problema. A rede final atinge uma precisão de 99%, utilizando uma técnica de "transfer learning". Estes resultados foram obtidos num conjunto de imagens recolhidas e classificadas manualmente segundo cada tipo de plano fotográfico, tendo sido usado parte deste conjunto de dados no treino das próprias redes. Para determinar o enquadramento fotográfico, é proposto um método que utiliza um algoritmo de deteção facial seguido de um algoritmo de deteção de olhos que, com base na regra dos terços dá indicações ao utilizador sobre como corrigir o enquadramento. Foram comparados vários algoritmos de deteção facial tanto ao nível da eficácia de deteção como do tempo de processamento, onde a solução final assegura o equilíbrio entre os dois atingindo uma taxa de deteção de 91%. Foi também analisada a posição dos olhos num conjunto de imagens consideradas como tendo um bom enquadramento, as quais serviram para determinar um valor de tolerância que serviu como complemento para a regra dos terços.
publishDate 2018
dc.date.none.fl_str_mv 2018-11-20T00:00:00Z
2018-11-20
2018-10
2021-11-20T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10071/18478
TID:202127443
url http://hdl.handle.net/10071/18478
identifier_str_mv TID:202127443
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
application/octet-stream
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799134736359096320