Desenvolvimento de uma interface humano-robô utilizando visão computacional e sistemas a eventos discretos
Autor(a) principal: | |
---|---|
Data de Publicação: | 2006 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFMG |
Texto Completo: | http://hdl.handle.net/1843/RVMR-6WDNLV |
Resumo: | Este trabalho apresenta uma nova abordagem para o desenvolvimento de interfaces visuais humano-robô baseadas em visão computacional. O método proposto se baseia na utilização de uma linguagem composta por gestos simples, onde um gesto isolado não possui qualquer significado, mas uma palavra, composta por uma seqüência de gestos realizados na ordem correta, gera uma resposta. Dessa maneira, pode ser definida uma gramática e associada uma ação do robô a cada uma dessas palavras, permitindo ao operador humano comandar o robô de maneira intuitiva.Considerando apenas gestos simples, o sistema de visão computacional privilegia a robustez se baseando em técnicas qualitativas, menos precisas porém mais robustas. A saída do sistema de visão computacional é processada por um sistema a eventos discretos estocástico que detecta a execução de comandos. O reconhecimento é realizado de maneira contínua, sendo o início e o fim de cada gesto identificados implicitamente pelo modelo. Foram utilizados dois tipos de sistemas a eventos discretos: cadeias de Markov e Modelos Ocultos de Markov (MOMs, do inglês, Hidden Markov Models). Para ambos os tipos foi desenvolvida uma metodologia para a construção automática do modelo.Os testes realizados comprovam a eficácia do método mesmo em ambientes complexos e com o executor dos gestos se movendo. Foi comprovada a robustez do método e a baixa incidência de falsos positivos, principalmente para os MOMs. A utilização de MOMs no contexto proposto apresentou desempenho superior ao das cadeias de Markov. Também foi identificada a importância da escolha correta dos comandos da gramática, para evitar uma deterioração significativa da taxa de reconhecimento à medida que a quantidade de comandos aumenta. |
id |
UFMG_d1f1b38b90935c6247a5bf7f2644f5ad |
---|---|
oai_identifier_str |
oai:repositorio.ufmg.br:1843/RVMR-6WDNLV |
network_acronym_str |
UFMG |
network_name_str |
Repositório Institucional da UFMG |
repository_id_str |
|
spelling |
Guilherme Augusto Silva PereiraRodrigo Lima CarceroniCarlos Andrey MaiaMario Fernando Montenegro CamposRaoni Maira Resende2019-08-13T18:11:08Z2019-08-13T18:11:08Z2006-08-03http://hdl.handle.net/1843/RVMR-6WDNLVEste trabalho apresenta uma nova abordagem para o desenvolvimento de interfaces visuais humano-robô baseadas em visão computacional. O método proposto se baseia na utilização de uma linguagem composta por gestos simples, onde um gesto isolado não possui qualquer significado, mas uma palavra, composta por uma seqüência de gestos realizados na ordem correta, gera uma resposta. Dessa maneira, pode ser definida uma gramática e associada uma ação do robô a cada uma dessas palavras, permitindo ao operador humano comandar o robô de maneira intuitiva.Considerando apenas gestos simples, o sistema de visão computacional privilegia a robustez se baseando em técnicas qualitativas, menos precisas porém mais robustas. A saída do sistema de visão computacional é processada por um sistema a eventos discretos estocástico que detecta a execução de comandos. O reconhecimento é realizado de maneira contínua, sendo o início e o fim de cada gesto identificados implicitamente pelo modelo. Foram utilizados dois tipos de sistemas a eventos discretos: cadeias de Markov e Modelos Ocultos de Markov (MOMs, do inglês, Hidden Markov Models). Para ambos os tipos foi desenvolvida uma metodologia para a construção automática do modelo.Os testes realizados comprovam a eficácia do método mesmo em ambientes complexos e com o executor dos gestos se movendo. Foi comprovada a robustez do método e a baixa incidência de falsos positivos, principalmente para os MOMs. A utilização de MOMs no contexto proposto apresentou desempenho superior ao das cadeias de Markov. Também foi identificada a importância da escolha correta dos comandos da gramática, para evitar uma deterioração significativa da taxa de reconhecimento à medida que a quantidade de comandos aumenta.This work presents a computer vision human-robot interface based on gesture recognition. A grammar composed of strings of simple gestures is defined so that an isolated gesture has no meaning to the system, and only a sequence of gestures performed in the correct order, according to the grammar, will issue a command to the robot. Each of these words, made of gestures, can be associated to a command, which will be issued to the robot everytime it's recognized. Through the use of this interface, a human operator can control a robot in a natural and intuitive way.Since only simple gestures are considered, the computer vision system is based on qualitative techniques that exhibits robustness properties. The output of the computer vision system is passed on to a stochastic discrete event system which is responsible for the commands recognition. Continuous gesture recognition is performed and the model implicitly identifies the beginning and the end of each gesture. Two types of discrete event systems were employed: Markov chains and Hidden Markov Models (HMM). The models were built automatically for both of these types.Experimental results shows that the proposed methodology yields robust recognition with low ocurrence of false positives even in complex backgrounds and with the operator moving. The HMMs outperformed the Markov chains in the proposed methodology context. The commands must be correctly chosen to avoid serious degradation of the performance as the number of considered commands increase.Universidade Federal de Minas GeraisUFMGInterfaces de usuário (Sistema de computador)Markov, processos deVisão por computadorComputaçãointerfaces visuaishumano-robôDesenvolvimento de uma interface humano-robô utilizando visão computacional e sistemas a eventos discretosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINALraonimairaresende.pdfapplication/pdf504766https://repositorio.ufmg.br/bitstream/1843/RVMR-6WDNLV/1/raonimairaresende.pdf20524bdf4d406dc7af82e0f4ecd32169MD51TEXTraonimairaresende.pdf.txtraonimairaresende.pdf.txtExtracted texttext/plain154241https://repositorio.ufmg.br/bitstream/1843/RVMR-6WDNLV/2/raonimairaresende.pdf.txt233adcf6539b54c4f4f42071513ab614MD521843/RVMR-6WDNLV2019-11-14 03:18:20.527oai:repositorio.ufmg.br:1843/RVMR-6WDNLVRepositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2019-11-14T06:18:20Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false |
dc.title.pt_BR.fl_str_mv |
Desenvolvimento de uma interface humano-robô utilizando visão computacional e sistemas a eventos discretos |
title |
Desenvolvimento de uma interface humano-robô utilizando visão computacional e sistemas a eventos discretos |
spellingShingle |
Desenvolvimento de uma interface humano-robô utilizando visão computacional e sistemas a eventos discretos Raoni Maira Resende interfaces visuais humano-robô Interfaces de usuário (Sistema de computador) Markov, processos de Visão por computador Computação |
title_short |
Desenvolvimento de uma interface humano-robô utilizando visão computacional e sistemas a eventos discretos |
title_full |
Desenvolvimento de uma interface humano-robô utilizando visão computacional e sistemas a eventos discretos |
title_fullStr |
Desenvolvimento de uma interface humano-robô utilizando visão computacional e sistemas a eventos discretos |
title_full_unstemmed |
Desenvolvimento de uma interface humano-robô utilizando visão computacional e sistemas a eventos discretos |
title_sort |
Desenvolvimento de uma interface humano-robô utilizando visão computacional e sistemas a eventos discretos |
author |
Raoni Maira Resende |
author_facet |
Raoni Maira Resende |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Guilherme Augusto Silva Pereira |
dc.contributor.advisor-co1.fl_str_mv |
Rodrigo Lima Carceroni |
dc.contributor.referee1.fl_str_mv |
Carlos Andrey Maia |
dc.contributor.referee2.fl_str_mv |
Mario Fernando Montenegro Campos |
dc.contributor.author.fl_str_mv |
Raoni Maira Resende |
contributor_str_mv |
Guilherme Augusto Silva Pereira Rodrigo Lima Carceroni Carlos Andrey Maia Mario Fernando Montenegro Campos |
dc.subject.por.fl_str_mv |
interfaces visuais humano-robô |
topic |
interfaces visuais humano-robô Interfaces de usuário (Sistema de computador) Markov, processos de Visão por computador Computação |
dc.subject.other.pt_BR.fl_str_mv |
Interfaces de usuário (Sistema de computador) Markov, processos de Visão por computador Computação |
description |
Este trabalho apresenta uma nova abordagem para o desenvolvimento de interfaces visuais humano-robô baseadas em visão computacional. O método proposto se baseia na utilização de uma linguagem composta por gestos simples, onde um gesto isolado não possui qualquer significado, mas uma palavra, composta por uma seqüência de gestos realizados na ordem correta, gera uma resposta. Dessa maneira, pode ser definida uma gramática e associada uma ação do robô a cada uma dessas palavras, permitindo ao operador humano comandar o robô de maneira intuitiva.Considerando apenas gestos simples, o sistema de visão computacional privilegia a robustez se baseando em técnicas qualitativas, menos precisas porém mais robustas. A saída do sistema de visão computacional é processada por um sistema a eventos discretos estocástico que detecta a execução de comandos. O reconhecimento é realizado de maneira contínua, sendo o início e o fim de cada gesto identificados implicitamente pelo modelo. Foram utilizados dois tipos de sistemas a eventos discretos: cadeias de Markov e Modelos Ocultos de Markov (MOMs, do inglês, Hidden Markov Models). Para ambos os tipos foi desenvolvida uma metodologia para a construção automática do modelo.Os testes realizados comprovam a eficácia do método mesmo em ambientes complexos e com o executor dos gestos se movendo. Foi comprovada a robustez do método e a baixa incidência de falsos positivos, principalmente para os MOMs. A utilização de MOMs no contexto proposto apresentou desempenho superior ao das cadeias de Markov. Também foi identificada a importância da escolha correta dos comandos da gramática, para evitar uma deterioração significativa da taxa de reconhecimento à medida que a quantidade de comandos aumenta. |
publishDate |
2006 |
dc.date.issued.fl_str_mv |
2006-08-03 |
dc.date.accessioned.fl_str_mv |
2019-08-13T18:11:08Z |
dc.date.available.fl_str_mv |
2019-08-13T18:11:08Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/1843/RVMR-6WDNLV |
url |
http://hdl.handle.net/1843/RVMR-6WDNLV |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Minas Gerais |
dc.publisher.initials.fl_str_mv |
UFMG |
publisher.none.fl_str_mv |
Universidade Federal de Minas Gerais |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFMG instname:Universidade Federal de Minas Gerais (UFMG) instacron:UFMG |
instname_str |
Universidade Federal de Minas Gerais (UFMG) |
instacron_str |
UFMG |
institution |
UFMG |
reponame_str |
Repositório Institucional da UFMG |
collection |
Repositório Institucional da UFMG |
bitstream.url.fl_str_mv |
https://repositorio.ufmg.br/bitstream/1843/RVMR-6WDNLV/1/raonimairaresende.pdf https://repositorio.ufmg.br/bitstream/1843/RVMR-6WDNLV/2/raonimairaresende.pdf.txt |
bitstream.checksum.fl_str_mv |
20524bdf4d406dc7af82e0f4ecd32169 233adcf6539b54c4f4f42071513ab614 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG) |
repository.mail.fl_str_mv |
|
_version_ |
1797971022260994048 |