Aprendizagem profunda para reconhecimento de gestos da mão usando imagens e esqueletos com aplicações em Libras

Detalhes bibliográficos
Autor(a) principal: Voigt, Johann Felipe
Data de Publicação: 2018
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da Universidade Federal de Alagoas (UFAL)
Texto Completo: http://www.repositorio.ufal.br/handle/riufal/3784
Resumo: In this work we present methodologies based on Deep Learning for the recognition of static and dynamic gestures of the hand, with applications in signs of Libras (Brazilian Sign Language). Through data captured by the Leap Motion device, including both images and skeletons of the palm, we evaluated several architectures of Neural Networks to recognize gestures, with emphasis on signs of Libras. The methodologies can be described in three stages. In the first one, we sought to recognize static gestures (poses) using multilayer perceptron networks (MLP) for skeletal data, convolutional networks (CNN) for images, and multiple input networks using both types of information. In the second, we individually classify gestures that include motion, and for this we include recurrent Long Short-Term Memory (LSTM) layers in our architectures. To make the process even more precise, we apply Learning Transfer to the convolutional blocks, bringing the previously trained parameters with the static poses into the network designed for the dynamic gestures, and evaluate the result with and without the transfer. Finally, we present a new algorithm that allows us to recognize online the same dynamic gestures from the previous step, but executed sequentially, without pauses, and without having information about the beginning and end of the execution of each gesture.
id UFAL_1f486dd1c64a9d2f40244d462f5d34ad
oai_identifier_str oai:www.repositorio.ufal.br:riufal/3784
network_acronym_str UFAL
network_name_str Repositório Institucional da Universidade Federal de Alagoas (UFAL)
repository_id_str
spelling Aprendizagem profunda para reconhecimento de gestos da mão usando imagens e esqueletos com aplicações em LibrasDeep learning for hand gestures recognition using images and skeletons with Libras applicationsMatemática – Estudo e ensinoLíngua brasileira de sinaisRedes neuraisReconhecimento de gestosMathematics - Study and teachingBrazilian Sign LanguageNeural networksGesture recognitionLeap motionCNPQ::CIENCIAS EXATAS E DA TERRA::MATEMATICAIn this work we present methodologies based on Deep Learning for the recognition of static and dynamic gestures of the hand, with applications in signs of Libras (Brazilian Sign Language). Through data captured by the Leap Motion device, including both images and skeletons of the palm, we evaluated several architectures of Neural Networks to recognize gestures, with emphasis on signs of Libras. The methodologies can be described in three stages. In the first one, we sought to recognize static gestures (poses) using multilayer perceptron networks (MLP) for skeletal data, convolutional networks (CNN) for images, and multiple input networks using both types of information. In the second, we individually classify gestures that include motion, and for this we include recurrent Long Short-Term Memory (LSTM) layers in our architectures. To make the process even more precise, we apply Learning Transfer to the convolutional blocks, bringing the previously trained parameters with the static poses into the network designed for the dynamic gestures, and evaluate the result with and without the transfer. Finally, we present a new algorithm that allows us to recognize online the same dynamic gestures from the previous step, but executed sequentially, without pauses, and without having information about the beginning and end of the execution of each gesture.Neste trabalho apresentamos metodologias baseadas em Aprendizagem Profunda (Deep Learning) para reconhecimento de gestos estáticos e dinâmicos da mão, com aplicações em sinais de Libras. Através de dados capturados pelo dispositivo Leap Motion, incluindo tanto imagens quanto esqueletos da palma da mão, avaliamos diversas arquiteturas de Redes Neurais para reconhecer gestos, com ênfase em sinais de Libras. As metodologias podem ser descritas em três etapas. Na primeira, buscamos reconhecer os gestos estáticos (poses) usando redes perceptron multicamadas (MLP) para os dados do esqueleto, redes convolucionais (CNN) para as imagens, e redes de múltiplas entradas, utilizando ambos os tipos de informação. Na segunda, classificamos individualmente gestos que incluam movimento, e para tanto incluímos camadas recorrentes Long Short-Term Memory (LSTM) em nossas arquiteturas. Para tornar o processo ainda mais preciso, aplicamos Transferência de Aprendizado nos blocos convolucionais, trazendo os parâmetros já treinados com as poses estáticas para dentro da rede projetada para os gestos dinâmicos, e avaliamos o resultado com e sem a transferência. Por fim, apresentamos um novo algoritmo que nos permita reconhecer online os mesmos gestos dinâmicos da etapa anterior, mas executados de forma sequencial, sem pausas, e sem ter informação sobre o início e final da execução de cada gesto.Universidade Federal de AlagoasBrasilPrograma de Pós-Graduação em MatemáticaUFALVieira, Thales Miranda de Almeidahttp://lattes.cnpq.br/8181104476035846Silva, Adelailson Peixoto dahttp://lattes.cnpq.br/3899898023629349Morera, Dimas Martinezhttp://lattes.cnpq.br/9474423287192932Vieira, Tiago Figueiredohttp://lattes.cnpq.br/8601011832053651Voigt, Johann Felipe2019-01-29T14:58:30Z2019-01-282019-01-29T14:58:30Z2018-12-05info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfVOIGT, Johann Felipe. Aprendizagem profunda para reconhecimento de gestos da mão usando imagens e esqueletos com aplicações em Libras. 2018. 92 f. Dissertação (Mestrado em Matemática) – Instituto de Matemática, Programa de Pós Graduação em Matemática, Universidade Federal de Alagoas, Maceió, 2018.http://www.repositorio.ufal.br/handle/riufal/3784porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da Universidade Federal de Alagoas (UFAL)instname:Universidade Federal de Alagoas (UFAL)instacron:UFAL2019-12-04T20:03:21Zoai:www.repositorio.ufal.br:riufal/3784Repositório InstitucionalPUBhttp://www.repositorio.ufal.br/oai/requestri@sibi.ufal.bropendoar:2019-12-04T20:03:21Repositório Institucional da Universidade Federal de Alagoas (UFAL) - Universidade Federal de Alagoas (UFAL)false
dc.title.none.fl_str_mv Aprendizagem profunda para reconhecimento de gestos da mão usando imagens e esqueletos com aplicações em Libras
Deep learning for hand gestures recognition using images and skeletons with Libras applications
title Aprendizagem profunda para reconhecimento de gestos da mão usando imagens e esqueletos com aplicações em Libras
spellingShingle Aprendizagem profunda para reconhecimento de gestos da mão usando imagens e esqueletos com aplicações em Libras
Voigt, Johann Felipe
Matemática – Estudo e ensino
Língua brasileira de sinais
Redes neurais
Reconhecimento de gestos
Mathematics - Study and teaching
Brazilian Sign Language
Neural networks
Gesture recognition
Leap motion
CNPQ::CIENCIAS EXATAS E DA TERRA::MATEMATICA
title_short Aprendizagem profunda para reconhecimento de gestos da mão usando imagens e esqueletos com aplicações em Libras
title_full Aprendizagem profunda para reconhecimento de gestos da mão usando imagens e esqueletos com aplicações em Libras
title_fullStr Aprendizagem profunda para reconhecimento de gestos da mão usando imagens e esqueletos com aplicações em Libras
title_full_unstemmed Aprendizagem profunda para reconhecimento de gestos da mão usando imagens e esqueletos com aplicações em Libras
title_sort Aprendizagem profunda para reconhecimento de gestos da mão usando imagens e esqueletos com aplicações em Libras
author Voigt, Johann Felipe
author_facet Voigt, Johann Felipe
author_role author
dc.contributor.none.fl_str_mv Vieira, Thales Miranda de Almeida
http://lattes.cnpq.br/8181104476035846
Silva, Adelailson Peixoto da
http://lattes.cnpq.br/3899898023629349
Morera, Dimas Martinez
http://lattes.cnpq.br/9474423287192932
Vieira, Tiago Figueiredo
http://lattes.cnpq.br/8601011832053651
dc.contributor.author.fl_str_mv Voigt, Johann Felipe
dc.subject.por.fl_str_mv Matemática – Estudo e ensino
Língua brasileira de sinais
Redes neurais
Reconhecimento de gestos
Mathematics - Study and teaching
Brazilian Sign Language
Neural networks
Gesture recognition
Leap motion
CNPQ::CIENCIAS EXATAS E DA TERRA::MATEMATICA
topic Matemática – Estudo e ensino
Língua brasileira de sinais
Redes neurais
Reconhecimento de gestos
Mathematics - Study and teaching
Brazilian Sign Language
Neural networks
Gesture recognition
Leap motion
CNPQ::CIENCIAS EXATAS E DA TERRA::MATEMATICA
description In this work we present methodologies based on Deep Learning for the recognition of static and dynamic gestures of the hand, with applications in signs of Libras (Brazilian Sign Language). Through data captured by the Leap Motion device, including both images and skeletons of the palm, we evaluated several architectures of Neural Networks to recognize gestures, with emphasis on signs of Libras. The methodologies can be described in three stages. In the first one, we sought to recognize static gestures (poses) using multilayer perceptron networks (MLP) for skeletal data, convolutional networks (CNN) for images, and multiple input networks using both types of information. In the second, we individually classify gestures that include motion, and for this we include recurrent Long Short-Term Memory (LSTM) layers in our architectures. To make the process even more precise, we apply Learning Transfer to the convolutional blocks, bringing the previously trained parameters with the static poses into the network designed for the dynamic gestures, and evaluate the result with and without the transfer. Finally, we present a new algorithm that allows us to recognize online the same dynamic gestures from the previous step, but executed sequentially, without pauses, and without having information about the beginning and end of the execution of each gesture.
publishDate 2018
dc.date.none.fl_str_mv 2018-12-05
2019-01-29T14:58:30Z
2019-01-28
2019-01-29T14:58:30Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv VOIGT, Johann Felipe. Aprendizagem profunda para reconhecimento de gestos da mão usando imagens e esqueletos com aplicações em Libras. 2018. 92 f. Dissertação (Mestrado em Matemática) – Instituto de Matemática, Programa de Pós Graduação em Matemática, Universidade Federal de Alagoas, Maceió, 2018.
http://www.repositorio.ufal.br/handle/riufal/3784
identifier_str_mv VOIGT, Johann Felipe. Aprendizagem profunda para reconhecimento de gestos da mão usando imagens e esqueletos com aplicações em Libras. 2018. 92 f. Dissertação (Mestrado em Matemática) – Instituto de Matemática, Programa de Pós Graduação em Matemática, Universidade Federal de Alagoas, Maceió, 2018.
url http://www.repositorio.ufal.br/handle/riufal/3784
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal de Alagoas
Brasil
Programa de Pós-Graduação em Matemática
UFAL
publisher.none.fl_str_mv Universidade Federal de Alagoas
Brasil
Programa de Pós-Graduação em Matemática
UFAL
dc.source.none.fl_str_mv reponame:Repositório Institucional da Universidade Federal de Alagoas (UFAL)
instname:Universidade Federal de Alagoas (UFAL)
instacron:UFAL
instname_str Universidade Federal de Alagoas (UFAL)
instacron_str UFAL
institution UFAL
reponame_str Repositório Institucional da Universidade Federal de Alagoas (UFAL)
collection Repositório Institucional da Universidade Federal de Alagoas (UFAL)
repository.name.fl_str_mv Repositório Institucional da Universidade Federal de Alagoas (UFAL) - Universidade Federal de Alagoas (UFAL)
repository.mail.fl_str_mv ri@sibi.ufal.br
_version_ 1748233744528965632