Comparação de técnicas de aprendizado de máquina para a classificação de gestos para um sistema de interface homem-máquina sem contato

Detalhes bibliográficos
Autor(a) principal: Hoss, João Pedro Jacques
Data de Publicação: 2022
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UFRGS
Texto Completo: http://hdl.handle.net/10183/251792
Resumo: O reconhecimento de gestos de mão é um aspecto importante na comunicação interpessoal e com avanços tecnológicos na área de interação homem-máquina, tornou-se possível utilizar esses gestos como uma maneira do usuário interagir e controlar dispositivos. Nos últimos anos, diversos ramos da indústria veem desenvolvendo aplicações que utilizam o reconhecimento de gestos, como o ramo automotivo, ramo de robótica e ramo de realidade virtual, por exemplo. Levando em consideração estes últimos avanços importantes, esse trabalho explora a coleta de bases de dados, a análise dos dados coletados, o treinamento de diversos modelos de aprendizado de máquina sobre os dados até o desenvolvimento de uma aplicação simples utilizando um sistema de interface homem-máquina controlada por gestos. Para isso, duas bases de dados foram coletadas onde cada amostra representa o esqueleto da mão do voluntário, obtido utilizando a ferramenta MediaPipe, formado por 21 pontos. Além disso, para ambas as bases de dados, foram realizadas coletadas de amostras a uma distância de 50 cm, 75 cm e 100 cm da webcam. Uma base de dados segue um projeto de experimento com aleatorização na coleta de dados tendo a participação de 5 voluntários para coletar um total de 450 amostras para cada um dos 10 gestos propostos. A outra não seguiu um projeto com aleatorização na coleta e contou com a participação de um único voluntário para coletar 4.500 amostras por gesto. Sobre essas bases de dados, foram criados modelos inteligentes capazes de classificar os gestos utilizando oito técnicas de aprendizado de máquina, sendo elas regressão logística, classificador Bayes ingênuo, máquina de suporte de vetor, árvore de decisão, floresta aleatória, XGBoost, rede neural simples e uma MLP. Sobre cada técnica foi realiza um processo de otimização de hiper parâmetros. Dessa forma, a técnica que resultou nos modelos com o melhor desempenho foi a técnica XGBoost. O modelo XGBoost treinado sobre a base de dados aleatorizada obteve uma taxa de acerto de 99,425 ± 0,135% e um valor F1-score de 99,375 ± 0,175%, e o modelo treinado sobre os dados não aleatorizado obteve 99,400 ± 0,069% e 99,355 ± 0,075% respectivamente como taxa de acerto e F1-score. Por fim, foi desenvolvido uma simples aplicação que utilize esse modelo onde o usuário consegue realizar comandos de controle em um computador.
id UFRGS-2_31605a125c78e0b3af3b9264812a327b
oai_identifier_str oai:www.lume.ufrgs.br:10183/251792
network_acronym_str UFRGS-2
network_name_str Repositório Institucional da UFRGS
repository_id_str
spelling Hoss, João Pedro JacquesWeber, Tiago Oliveira2022-11-25T04:46:37Z2022http://hdl.handle.net/10183/251792001153653O reconhecimento de gestos de mão é um aspecto importante na comunicação interpessoal e com avanços tecnológicos na área de interação homem-máquina, tornou-se possível utilizar esses gestos como uma maneira do usuário interagir e controlar dispositivos. Nos últimos anos, diversos ramos da indústria veem desenvolvendo aplicações que utilizam o reconhecimento de gestos, como o ramo automotivo, ramo de robótica e ramo de realidade virtual, por exemplo. Levando em consideração estes últimos avanços importantes, esse trabalho explora a coleta de bases de dados, a análise dos dados coletados, o treinamento de diversos modelos de aprendizado de máquina sobre os dados até o desenvolvimento de uma aplicação simples utilizando um sistema de interface homem-máquina controlada por gestos. Para isso, duas bases de dados foram coletadas onde cada amostra representa o esqueleto da mão do voluntário, obtido utilizando a ferramenta MediaPipe, formado por 21 pontos. Além disso, para ambas as bases de dados, foram realizadas coletadas de amostras a uma distância de 50 cm, 75 cm e 100 cm da webcam. Uma base de dados segue um projeto de experimento com aleatorização na coleta de dados tendo a participação de 5 voluntários para coletar um total de 450 amostras para cada um dos 10 gestos propostos. A outra não seguiu um projeto com aleatorização na coleta e contou com a participação de um único voluntário para coletar 4.500 amostras por gesto. Sobre essas bases de dados, foram criados modelos inteligentes capazes de classificar os gestos utilizando oito técnicas de aprendizado de máquina, sendo elas regressão logística, classificador Bayes ingênuo, máquina de suporte de vetor, árvore de decisão, floresta aleatória, XGBoost, rede neural simples e uma MLP. Sobre cada técnica foi realiza um processo de otimização de hiper parâmetros. Dessa forma, a técnica que resultou nos modelos com o melhor desempenho foi a técnica XGBoost. O modelo XGBoost treinado sobre a base de dados aleatorizada obteve uma taxa de acerto de 99,425 ± 0,135% e um valor F1-score de 99,375 ± 0,175%, e o modelo treinado sobre os dados não aleatorizado obteve 99,400 ± 0,069% e 99,355 ± 0,075% respectivamente como taxa de acerto e F1-score. Por fim, foi desenvolvido uma simples aplicação que utilize esse modelo onde o usuário consegue realizar comandos de controle em um computador.Hand gestures recognition is an important aspect in interpersonal communication and with technological advances in the area of human-machine interaction, it has become possible to use these gestures as a way for the user to interact and control devices. In recent years, several branches of the industry have been developing applications that use gesture recognition, such as the automotive branch, robotics and virtual reality branch, for example. Considering these last important advances, this work explores the collection of databases, the analysis of the collected data, the training of different machine learning models on the data until the development of a simple application using a gesture-controlled human-machine interface system. For this, two databases were collected where each sample represents the skeleton of the volunteer's hand, obtained using the MediaPipe tool, formed by 21 points. In addition, for both databases, samples were collected at a distance of 50 cm, 75 cm and 100 cm from the webcam. A database follows an experiment design with randomization in data collection with the participation of 5 volunteers to collect a total of 450 samples for each of the 10 proposed gestures. The other did not follow a project with randomization in the collection and had the participation of a single volunteer to collect 4,500 samples per gesture. On these databases, intelligent models were created capable of classifying gestures using eight machine learning techniques, namely logistic regression, naive Bayes classifier, support vector machine, decision tree, random forest, XGBoost, simple neural network and a MLP. A hyperparameter optimization process was performed on each technique. Thus, the technique that resulted in the models with the best performance was the XGBoost technique. The XGBoost model trained on the randomized database obtained a hit rate of 99.425 ± 0.135% and an F1-score of 99.375 ± 0.175%, and the model trained on the non-randomized data obtained 99.400 ± 0.069% and 99.355 ± 0.075 % respectively as hit rate and F1-score. Finally, a simple application was developed that uses this model where the user can perform control commands on a computer.application/pdfporAprendizado de máquinaReconhecimento de padrõesInteração homem-máquinaHyper parameters optimizationMachine learningXGBoostMan-machine interfaceComparação de técnicas de aprendizado de máquina para a classificação de gestos para um sistema de interface homem-máquina sem contatoinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisUniversidade Federal do Rio Grande do SulEscola de EngenhariaPorto Alegre, BR-RS2022Engenharia Elétricagraduaçãoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001153653.pdf.txt001153653.pdf.txtExtracted Texttext/plain147971http://www.lume.ufrgs.br/bitstream/10183/251792/2/001153653.pdf.txt7ccb4154cf319227dbdebab7ff936048MD52ORIGINAL001153653.pdfTexto completoapplication/pdf3965172http://www.lume.ufrgs.br/bitstream/10183/251792/1/001153653.pdfb457b5efd8f5c6718f0209137bd67654MD5110183/2517922022-11-26 06:01:24.574338oai:www.lume.ufrgs.br:10183/251792Repositório de PublicaçõesPUBhttps://lume.ufrgs.br/oai/requestopendoar:2022-11-26T08:01:24Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Comparação de técnicas de aprendizado de máquina para a classificação de gestos para um sistema de interface homem-máquina sem contato
title Comparação de técnicas de aprendizado de máquina para a classificação de gestos para um sistema de interface homem-máquina sem contato
spellingShingle Comparação de técnicas de aprendizado de máquina para a classificação de gestos para um sistema de interface homem-máquina sem contato
Hoss, João Pedro Jacques
Aprendizado de máquina
Reconhecimento de padrões
Interação homem-máquina
Hyper parameters optimization
Machine learning
XGBoost
Man-machine interface
title_short Comparação de técnicas de aprendizado de máquina para a classificação de gestos para um sistema de interface homem-máquina sem contato
title_full Comparação de técnicas de aprendizado de máquina para a classificação de gestos para um sistema de interface homem-máquina sem contato
title_fullStr Comparação de técnicas de aprendizado de máquina para a classificação de gestos para um sistema de interface homem-máquina sem contato
title_full_unstemmed Comparação de técnicas de aprendizado de máquina para a classificação de gestos para um sistema de interface homem-máquina sem contato
title_sort Comparação de técnicas de aprendizado de máquina para a classificação de gestos para um sistema de interface homem-máquina sem contato
author Hoss, João Pedro Jacques
author_facet Hoss, João Pedro Jacques
author_role author
dc.contributor.author.fl_str_mv Hoss, João Pedro Jacques
dc.contributor.advisor1.fl_str_mv Weber, Tiago Oliveira
contributor_str_mv Weber, Tiago Oliveira
dc.subject.por.fl_str_mv Aprendizado de máquina
Reconhecimento de padrões
Interação homem-máquina
topic Aprendizado de máquina
Reconhecimento de padrões
Interação homem-máquina
Hyper parameters optimization
Machine learning
XGBoost
Man-machine interface
dc.subject.eng.fl_str_mv Hyper parameters optimization
Machine learning
XGBoost
Man-machine interface
description O reconhecimento de gestos de mão é um aspecto importante na comunicação interpessoal e com avanços tecnológicos na área de interação homem-máquina, tornou-se possível utilizar esses gestos como uma maneira do usuário interagir e controlar dispositivos. Nos últimos anos, diversos ramos da indústria veem desenvolvendo aplicações que utilizam o reconhecimento de gestos, como o ramo automotivo, ramo de robótica e ramo de realidade virtual, por exemplo. Levando em consideração estes últimos avanços importantes, esse trabalho explora a coleta de bases de dados, a análise dos dados coletados, o treinamento de diversos modelos de aprendizado de máquina sobre os dados até o desenvolvimento de uma aplicação simples utilizando um sistema de interface homem-máquina controlada por gestos. Para isso, duas bases de dados foram coletadas onde cada amostra representa o esqueleto da mão do voluntário, obtido utilizando a ferramenta MediaPipe, formado por 21 pontos. Além disso, para ambas as bases de dados, foram realizadas coletadas de amostras a uma distância de 50 cm, 75 cm e 100 cm da webcam. Uma base de dados segue um projeto de experimento com aleatorização na coleta de dados tendo a participação de 5 voluntários para coletar um total de 450 amostras para cada um dos 10 gestos propostos. A outra não seguiu um projeto com aleatorização na coleta e contou com a participação de um único voluntário para coletar 4.500 amostras por gesto. Sobre essas bases de dados, foram criados modelos inteligentes capazes de classificar os gestos utilizando oito técnicas de aprendizado de máquina, sendo elas regressão logística, classificador Bayes ingênuo, máquina de suporte de vetor, árvore de decisão, floresta aleatória, XGBoost, rede neural simples e uma MLP. Sobre cada técnica foi realiza um processo de otimização de hiper parâmetros. Dessa forma, a técnica que resultou nos modelos com o melhor desempenho foi a técnica XGBoost. O modelo XGBoost treinado sobre a base de dados aleatorizada obteve uma taxa de acerto de 99,425 ± 0,135% e um valor F1-score de 99,375 ± 0,175%, e o modelo treinado sobre os dados não aleatorizado obteve 99,400 ± 0,069% e 99,355 ± 0,075% respectivamente como taxa de acerto e F1-score. Por fim, foi desenvolvido uma simples aplicação que utilize esse modelo onde o usuário consegue realizar comandos de controle em um computador.
publishDate 2022
dc.date.accessioned.fl_str_mv 2022-11-25T04:46:37Z
dc.date.issued.fl_str_mv 2022
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/251792
dc.identifier.nrb.pt_BR.fl_str_mv 001153653
url http://hdl.handle.net/10183/251792
identifier_str_mv 001153653
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Repositório Institucional da UFRGS
collection Repositório Institucional da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/251792/2/001153653.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/251792/1/001153653.pdf
bitstream.checksum.fl_str_mv 7ccb4154cf319227dbdebab7ff936048
b457b5efd8f5c6718f0209137bd67654
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv
_version_ 1801224645077106688