Desenvolvimento de uma interface humano-robô utilizando visão computacional e sistemas a eventos discretos

Raoni Maira Resende

Desenvolvimento de uma interface humano-robô utilizando visão computacional e sistemas a eventos discretos

Detalhes bibliográficos
Autor(a) principal:	Raoni Maira Resende
Data de Publicação:	2006
Tipo de documento:	Dissertação
Idioma:	por
Título da fonte:	Repositório Institucional da UFMG
Texto Completo:	http://hdl.handle.net/1843/RVMR-6WDNLV
Resumo:	Este trabalho apresenta uma nova abordagem para o desenvolvimento de interfaces visuais humano-robô baseadas em visão computacional. O método proposto se baseia na utilização de uma linguagem composta por gestos simples, onde um gesto isolado não possui qualquer significado, mas uma palavra, composta por uma seqüência de gestos realizados na ordem correta, gera uma resposta. Dessa maneira, pode ser definida uma gramática e associada uma ação do robô a cada uma dessas palavras, permitindo ao operador humano comandar o robô de maneira intuitiva.Considerando apenas gestos simples, o sistema de visão computacional privilegia a robustez se baseando em técnicas qualitativas, menos precisas porém mais robustas. A saída do sistema de visão computacional é processada por um sistema a eventos discretos estocástico que detecta a execução de comandos. O reconhecimento é realizado de maneira contínua, sendo o início e o fim de cada gesto identificados implicitamente pelo modelo. Foram utilizados dois tipos de sistemas a eventos discretos: cadeias de Markov e Modelos Ocultos de Markov (MOMs, do inglês, Hidden Markov Models). Para ambos os tipos foi desenvolvida uma metodologia para a construção automática do modelo.Os testes realizados comprovam a eficácia do método mesmo em ambientes complexos e com o executor dos gestos se movendo. Foi comprovada a robustez do método e a baixa incidência de falsos positivos, principalmente para os MOMs. A utilização de MOMs no contexto proposto apresentou desempenho superior ao das cadeias de Markov. Também foi identificada a importância da escolha correta dos comandos da gramática, para evitar uma deterioração significativa da taxa de reconhecimento à medida que a quantidade de comandos aumenta.

Metadados do item

id	UFMG_d1f1b38b90935c6247a5bf7f2644f5ad
oai_identifier_str	oai:repositorio.ufmg.br:1843/RVMR-6WDNLV
network_acronym_str	UFMG
network_name_str	Repositório Institucional da UFMG
repository_id_str
spelling	Guilherme Augusto Silva PereiraRodrigo Lima CarceroniCarlos Andrey MaiaMario Fernando Montenegro CamposRaoni Maira Resende2019-08-13T18:11:08Z2019-08-13T18:11:08Z2006-08-03http://hdl.handle.net/1843/RVMR-6WDNLVEste trabalho apresenta uma nova abordagem para o desenvolvimento de interfaces visuais humano-robô baseadas em visão computacional. O método proposto se baseia na utilização de uma linguagem composta por gestos simples, onde um gesto isolado não possui qualquer significado, mas uma palavra, composta por uma seqüência de gestos realizados na ordem correta, gera uma resposta. Dessa maneira, pode ser definida uma gramática e associada uma ação do robô a cada uma dessas palavras, permitindo ao operador humano comandar o robô de maneira intuitiva.Considerando apenas gestos simples, o sistema de visão computacional privilegia a robustez se baseando em técnicas qualitativas, menos precisas porém mais robustas. A saída do sistema de visão computacional é processada por um sistema a eventos discretos estocástico que detecta a execução de comandos. O reconhecimento é realizado de maneira contínua, sendo o início e o fim de cada gesto identificados implicitamente pelo modelo. Foram utilizados dois tipos de sistemas a eventos discretos: cadeias de Markov e Modelos Ocultos de Markov (MOMs, do inglês, Hidden Markov Models). Para ambos os tipos foi desenvolvida uma metodologia para a construção automática do modelo.Os testes realizados comprovam a eficácia do método mesmo em ambientes complexos e com o executor dos gestos se movendo. Foi comprovada a robustez do método e a baixa incidência de falsos positivos, principalmente para os MOMs. A utilização de MOMs no contexto proposto apresentou desempenho superior ao das cadeias de Markov. Também foi identificada a importância da escolha correta dos comandos da gramática, para evitar uma deterioração significativa da taxa de reconhecimento à medida que a quantidade de comandos aumenta.This work presents a computer vision human-robot interface based on gesture recognition. A grammar composed of strings of simple gestures is defined so that an isolated gesture has no meaning to the system, and only a sequence of gestures performed in the correct order, according to the grammar, will issue a command to the robot. Each of these words, made of gestures, can be associated to a command, which will be issued to the robot everytime it's recognized. Through the use of this interface, a human operator can control a robot in a natural and intuitive way.Since only simple gestures are considered, the computer vision system is based on qualitative techniques that exhibits robustness properties. The output of the computer vision system is passed on to a stochastic discrete event system which is responsible for the commands recognition. Continuous gesture recognition is performed and the model implicitly identifies the beginning and the end of each gesture. Two types of discrete event systems were employed: Markov chains and Hidden Markov Models (HMM). The models were built automatically for both of these types.Experimental results shows that the proposed methodology yields robust recognition with low ocurrence of false positives even in complex backgrounds and with the operator moving. The HMMs outperformed the Markov chains in the proposed methodology context. The commands must be correctly chosen to avoid serious degradation of the performance as the number of considered commands increase.Universidade Federal de Minas GeraisUFMGInterfaces de usuário (Sistema de computador)Markov, processos deVisão por computadorComputaçãointerfaces visuaishumano-robôDesenvolvimento de uma interface humano-robô utilizando visão computacional e sistemas a eventos discretosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINALraonimairaresende.pdfapplication/pdf504766https://repositorio.ufmg.br/bitstream/1843/RVMR-6WDNLV/1/raonimairaresende.pdf20524bdf4d406dc7af82e0f4ecd32169MD51TEXTraonimairaresende.pdf.txtraonimairaresende.pdf.txtExtracted texttext/plain154241https://repositorio.ufmg.br/bitstream/1843/RVMR-6WDNLV/2/raonimairaresende.pdf.txt233adcf6539b54c4f4f42071513ab614MD521843/RVMR-6WDNLV2019-11-14 03:18:20.527oai:repositorio.ufmg.br:1843/RVMR-6WDNLVRepositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2019-11-14T06:18:20Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false
dc.title.pt_BR.fl_str_mv	Desenvolvimento de uma interface humano-robô utilizando visão computacional e sistemas a eventos discretos
title	Desenvolvimento de uma interface humano-robô utilizando visão computacional e sistemas a eventos discretos
spellingShingle	Desenvolvimento de uma interface humano-robô utilizando visão computacional e sistemas a eventos discretos Raoni Maira Resende interfaces visuais humano-robô Interfaces de usuário (Sistema de computador) Markov, processos de Visão por computador Computação
title_short	Desenvolvimento de uma interface humano-robô utilizando visão computacional e sistemas a eventos discretos
title_full	Desenvolvimento de uma interface humano-robô utilizando visão computacional e sistemas a eventos discretos
title_fullStr	Desenvolvimento de uma interface humano-robô utilizando visão computacional e sistemas a eventos discretos
title_full_unstemmed	Desenvolvimento de uma interface humano-robô utilizando visão computacional e sistemas a eventos discretos
title_sort	Desenvolvimento de uma interface humano-robô utilizando visão computacional e sistemas a eventos discretos
author	Raoni Maira Resende
author_facet	Raoni Maira Resende
author_role	author
dc.contributor.advisor1.fl_str_mv	Guilherme Augusto Silva Pereira
dc.contributor.advisor-co1.fl_str_mv	Rodrigo Lima Carceroni
dc.contributor.referee1.fl_str_mv	Carlos Andrey Maia
dc.contributor.referee2.fl_str_mv	Mario Fernando Montenegro Campos
dc.contributor.author.fl_str_mv	Raoni Maira Resende
contributor_str_mv	Guilherme Augusto Silva Pereira Rodrigo Lima Carceroni Carlos Andrey Maia Mario Fernando Montenegro Campos
dc.subject.por.fl_str_mv	interfaces visuais humano-robô
topic	interfaces visuais humano-robô Interfaces de usuário (Sistema de computador) Markov, processos de Visão por computador Computação
dc.subject.other.pt_BR.fl_str_mv	Interfaces de usuário (Sistema de computador) Markov, processos de Visão por computador Computação
description	Este trabalho apresenta uma nova abordagem para o desenvolvimento de interfaces visuais humano-robô baseadas em visão computacional. O método proposto se baseia na utilização de uma linguagem composta por gestos simples, onde um gesto isolado não possui qualquer significado, mas uma palavra, composta por uma seqüência de gestos realizados na ordem correta, gera uma resposta. Dessa maneira, pode ser definida uma gramática e associada uma ação do robô a cada uma dessas palavras, permitindo ao operador humano comandar o robô de maneira intuitiva.Considerando apenas gestos simples, o sistema de visão computacional privilegia a robustez se baseando em técnicas qualitativas, menos precisas porém mais robustas. A saída do sistema de visão computacional é processada por um sistema a eventos discretos estocástico que detecta a execução de comandos. O reconhecimento é realizado de maneira contínua, sendo o início e o fim de cada gesto identificados implicitamente pelo modelo. Foram utilizados dois tipos de sistemas a eventos discretos: cadeias de Markov e Modelos Ocultos de Markov (MOMs, do inglês, Hidden Markov Models). Para ambos os tipos foi desenvolvida uma metodologia para a construção automática do modelo.Os testes realizados comprovam a eficácia do método mesmo em ambientes complexos e com o executor dos gestos se movendo. Foi comprovada a robustez do método e a baixa incidência de falsos positivos, principalmente para os MOMs. A utilização de MOMs no contexto proposto apresentou desempenho superior ao das cadeias de Markov. Também foi identificada a importância da escolha correta dos comandos da gramática, para evitar uma deterioração significativa da taxa de reconhecimento à medida que a quantidade de comandos aumenta.
publishDate	2006
dc.date.issued.fl_str_mv	2006-08-03
dc.date.accessioned.fl_str_mv	2019-08-13T18:11:08Z
dc.date.available.fl_str_mv	2019-08-13T18:11:08Z
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	http://hdl.handle.net/1843/RVMR-6WDNLV
url	http://hdl.handle.net/1843/RVMR-6WDNLV
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.publisher.none.fl_str_mv	Universidade Federal de Minas Gerais
dc.publisher.initials.fl_str_mv	UFMG
publisher.none.fl_str_mv	Universidade Federal de Minas Gerais
dc.source.none.fl_str_mv	reponame:Repositório Institucional da UFMG instname:Universidade Federal de Minas Gerais (UFMG) instacron:UFMG
instname_str	Universidade Federal de Minas Gerais (UFMG)
instacron_str	UFMG
institution	UFMG
reponame_str	Repositório Institucional da UFMG
collection	Repositório Institucional da UFMG
bitstream.url.fl_str_mv	https://repositorio.ufmg.br/bitstream/1843/RVMR-6WDNLV/1/raonimairaresende.pdf https://repositorio.ufmg.br/bitstream/1843/RVMR-6WDNLV/2/raonimairaresende.pdf.txt
bitstream.checksum.fl_str_mv	20524bdf4d406dc7af82e0f4ecd32169 233adcf6539b54c4f4f42071513ab614
bitstream.checksumAlgorithm.fl_str_mv	MD5 MD5
repository.name.fl_str_mv	Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)
repository.mail.fl_str_mv
_version_	1797971022260994048

Desenvolvimento de uma interface humano-robô utilizando visão computacional e sistemas a eventos discretos

Registros relacionados