Desenvolvimento de uma interface humano-robô utilizando visão computacional e sistemas a eventos discretos

Detalhes bibliográficos
Autor(a) principal: Raoni Maira Resende
Data de Publicação: 2006
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFMG
Texto Completo: http://hdl.handle.net/1843/RVMR-6WDNLV
Resumo: Este trabalho apresenta uma nova abordagem para o desenvolvimento de interfaces visuais humano-robô baseadas em visão computacional. O método proposto se baseia na utilização de uma linguagem composta por gestos simples, onde um gesto isolado não possui qualquer significado, mas uma palavra, composta por uma seqüência de gestos realizados na ordem correta, gera uma resposta. Dessa maneira, pode ser definida uma gramática e associada uma ação do robô a cada uma dessas palavras, permitindo ao operador humano comandar o robô de maneira intuitiva.Considerando apenas gestos simples, o sistema de visão computacional privilegia a robustez se baseando em técnicas qualitativas, menos precisas porém mais robustas. A saída do sistema de visão computacional é processada por um sistema a eventos discretos estocástico que detecta a execução de comandos. O reconhecimento é realizado de maneira contínua, sendo o início e o fim de cada gesto identificados implicitamente pelo modelo. Foram utilizados dois tipos de sistemas a eventos discretos: cadeias de Markov e Modelos Ocultos de Markov (MOMs, do inglês, Hidden Markov Models). Para ambos os tipos foi desenvolvida uma metodologia para a construção automática do modelo.Os testes realizados comprovam a eficácia do método mesmo em ambientes complexos e com o executor dos gestos se movendo. Foi comprovada a robustez do método e a baixa incidência de falsos positivos, principalmente para os MOMs. A utilização de MOMs no contexto proposto apresentou desempenho superior ao das cadeias de Markov. Também foi identificada a importância da escolha correta dos comandos da gramática, para evitar uma deterioração significativa da taxa de reconhecimento à medida que a quantidade de comandos aumenta.
id UFMG_d1f1b38b90935c6247a5bf7f2644f5ad
oai_identifier_str oai:repositorio.ufmg.br:1843/RVMR-6WDNLV
network_acronym_str UFMG
network_name_str Repositório Institucional da UFMG
repository_id_str
spelling Guilherme Augusto Silva PereiraRodrigo Lima CarceroniCarlos Andrey MaiaMario Fernando Montenegro CamposRaoni Maira Resende2019-08-13T18:11:08Z2019-08-13T18:11:08Z2006-08-03http://hdl.handle.net/1843/RVMR-6WDNLVEste trabalho apresenta uma nova abordagem para o desenvolvimento de interfaces visuais humano-robô baseadas em visão computacional. O método proposto se baseia na utilização de uma linguagem composta por gestos simples, onde um gesto isolado não possui qualquer significado, mas uma palavra, composta por uma seqüência de gestos realizados na ordem correta, gera uma resposta. Dessa maneira, pode ser definida uma gramática e associada uma ação do robô a cada uma dessas palavras, permitindo ao operador humano comandar o robô de maneira intuitiva.Considerando apenas gestos simples, o sistema de visão computacional privilegia a robustez se baseando em técnicas qualitativas, menos precisas porém mais robustas. A saída do sistema de visão computacional é processada por um sistema a eventos discretos estocástico que detecta a execução de comandos. O reconhecimento é realizado de maneira contínua, sendo o início e o fim de cada gesto identificados implicitamente pelo modelo. Foram utilizados dois tipos de sistemas a eventos discretos: cadeias de Markov e Modelos Ocultos de Markov (MOMs, do inglês, Hidden Markov Models). Para ambos os tipos foi desenvolvida uma metodologia para a construção automática do modelo.Os testes realizados comprovam a eficácia do método mesmo em ambientes complexos e com o executor dos gestos se movendo. Foi comprovada a robustez do método e a baixa incidência de falsos positivos, principalmente para os MOMs. A utilização de MOMs no contexto proposto apresentou desempenho superior ao das cadeias de Markov. Também foi identificada a importância da escolha correta dos comandos da gramática, para evitar uma deterioração significativa da taxa de reconhecimento à medida que a quantidade de comandos aumenta.This work presents a computer vision human-robot interface based on gesture recognition. A grammar composed of strings of simple gestures is defined so that an isolated gesture has no meaning to the system, and only a sequence of gestures performed in the correct order, according to the grammar, will issue a command to the robot. Each of these words, made of gestures, can be associated to a command, which will be issued to the robot everytime it's recognized. Through the use of this interface, a human operator can control a robot in a natural and intuitive way.Since only simple gestures are considered, the computer vision system is based on qualitative techniques that exhibits robustness properties. The output of the computer vision system is passed on to a stochastic discrete event system which is responsible for the commands recognition. Continuous gesture recognition is performed and the model implicitly identifies the beginning and the end of each gesture. Two types of discrete event systems were employed: Markov chains and Hidden Markov Models (HMM). The models were built automatically for both of these types.Experimental results shows that the proposed methodology yields robust recognition with low ocurrence of false positives even in complex backgrounds and with the operator moving. The HMMs outperformed the Markov chains in the proposed methodology context. The commands must be correctly chosen to avoid serious degradation of the performance as the number of considered commands increase.Universidade Federal de Minas GeraisUFMGInterfaces de usuário (Sistema de computador)Markov, processos deVisão por computadorComputaçãointerfaces visuaishumano-robôDesenvolvimento de uma interface humano-robô utilizando visão computacional e sistemas a eventos discretosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINALraonimairaresende.pdfapplication/pdf504766https://repositorio.ufmg.br/bitstream/1843/RVMR-6WDNLV/1/raonimairaresende.pdf20524bdf4d406dc7af82e0f4ecd32169MD51TEXTraonimairaresende.pdf.txtraonimairaresende.pdf.txtExtracted texttext/plain154241https://repositorio.ufmg.br/bitstream/1843/RVMR-6WDNLV/2/raonimairaresende.pdf.txt233adcf6539b54c4f4f42071513ab614MD521843/RVMR-6WDNLV2019-11-14 03:18:20.527oai:repositorio.ufmg.br:1843/RVMR-6WDNLVRepositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2019-11-14T06:18:20Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false
dc.title.pt_BR.fl_str_mv Desenvolvimento de uma interface humano-robô utilizando visão computacional e sistemas a eventos discretos
title Desenvolvimento de uma interface humano-robô utilizando visão computacional e sistemas a eventos discretos
spellingShingle Desenvolvimento de uma interface humano-robô utilizando visão computacional e sistemas a eventos discretos
Raoni Maira Resende
interfaces visuais
humano-robô
Interfaces de usuário (Sistema de computador)
Markov, processos de
Visão por computador
Computação
title_short Desenvolvimento de uma interface humano-robô utilizando visão computacional e sistemas a eventos discretos
title_full Desenvolvimento de uma interface humano-robô utilizando visão computacional e sistemas a eventos discretos
title_fullStr Desenvolvimento de uma interface humano-robô utilizando visão computacional e sistemas a eventos discretos
title_full_unstemmed Desenvolvimento de uma interface humano-robô utilizando visão computacional e sistemas a eventos discretos
title_sort Desenvolvimento de uma interface humano-robô utilizando visão computacional e sistemas a eventos discretos
author Raoni Maira Resende
author_facet Raoni Maira Resende
author_role author
dc.contributor.advisor1.fl_str_mv Guilherme Augusto Silva Pereira
dc.contributor.advisor-co1.fl_str_mv Rodrigo Lima Carceroni
dc.contributor.referee1.fl_str_mv Carlos Andrey Maia
dc.contributor.referee2.fl_str_mv Mario Fernando Montenegro Campos
dc.contributor.author.fl_str_mv Raoni Maira Resende
contributor_str_mv Guilherme Augusto Silva Pereira
Rodrigo Lima Carceroni
Carlos Andrey Maia
Mario Fernando Montenegro Campos
dc.subject.por.fl_str_mv interfaces visuais
humano-robô
topic interfaces visuais
humano-robô
Interfaces de usuário (Sistema de computador)
Markov, processos de
Visão por computador
Computação
dc.subject.other.pt_BR.fl_str_mv Interfaces de usuário (Sistema de computador)
Markov, processos de
Visão por computador
Computação
description Este trabalho apresenta uma nova abordagem para o desenvolvimento de interfaces visuais humano-robô baseadas em visão computacional. O método proposto se baseia na utilização de uma linguagem composta por gestos simples, onde um gesto isolado não possui qualquer significado, mas uma palavra, composta por uma seqüência de gestos realizados na ordem correta, gera uma resposta. Dessa maneira, pode ser definida uma gramática e associada uma ação do robô a cada uma dessas palavras, permitindo ao operador humano comandar o robô de maneira intuitiva.Considerando apenas gestos simples, o sistema de visão computacional privilegia a robustez se baseando em técnicas qualitativas, menos precisas porém mais robustas. A saída do sistema de visão computacional é processada por um sistema a eventos discretos estocástico que detecta a execução de comandos. O reconhecimento é realizado de maneira contínua, sendo o início e o fim de cada gesto identificados implicitamente pelo modelo. Foram utilizados dois tipos de sistemas a eventos discretos: cadeias de Markov e Modelos Ocultos de Markov (MOMs, do inglês, Hidden Markov Models). Para ambos os tipos foi desenvolvida uma metodologia para a construção automática do modelo.Os testes realizados comprovam a eficácia do método mesmo em ambientes complexos e com o executor dos gestos se movendo. Foi comprovada a robustez do método e a baixa incidência de falsos positivos, principalmente para os MOMs. A utilização de MOMs no contexto proposto apresentou desempenho superior ao das cadeias de Markov. Também foi identificada a importância da escolha correta dos comandos da gramática, para evitar uma deterioração significativa da taxa de reconhecimento à medida que a quantidade de comandos aumenta.
publishDate 2006
dc.date.issued.fl_str_mv 2006-08-03
dc.date.accessioned.fl_str_mv 2019-08-13T18:11:08Z
dc.date.available.fl_str_mv 2019-08-13T18:11:08Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/1843/RVMR-6WDNLV
url http://hdl.handle.net/1843/RVMR-6WDNLV
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.publisher.initials.fl_str_mv UFMG
publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFMG
instname:Universidade Federal de Minas Gerais (UFMG)
instacron:UFMG
instname_str Universidade Federal de Minas Gerais (UFMG)
instacron_str UFMG
institution UFMG
reponame_str Repositório Institucional da UFMG
collection Repositório Institucional da UFMG
bitstream.url.fl_str_mv https://repositorio.ufmg.br/bitstream/1843/RVMR-6WDNLV/1/raonimairaresende.pdf
https://repositorio.ufmg.br/bitstream/1843/RVMR-6WDNLV/2/raonimairaresende.pdf.txt
bitstream.checksum.fl_str_mv 20524bdf4d406dc7af82e0f4ecd32169
233adcf6539b54c4f4f42071513ab614
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)
repository.mail.fl_str_mv
_version_ 1797971022260994048