Aprendizado por reforço profundo para robótica social usando sinais sociais e emoções faciais

Detalhes bibliográficos
Autor(a) principal: Belo, José Pedro Ribeiro
Data de Publicação: 2022
Tipo de documento: Tese
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da USP
Texto Completo: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-28022023-104023/
Resumo: A robótica social representa um ramo da interação humano-robô dedicado ao desenvolvimento de sistemas para controlar os robôs para operar em ambientes não estruturados com a presença de seres humanos. Robôs sociais devem interagir com seres humanos entendendo sinais sociais e respondendo adequadamente a eles. A maioria dos robôs sociais ainda são pré-programados, não tendo grande capacidade de aprender e responder com ações adequadas durante uma interação com humanos. Métodos mais elaborados usam movimentos corporais, direção do olhar e linguagem corporal. Nesta tese os sinais socialmente aceitáveis comumente utilizados durante uma interação são considerados para o treinamento de um robô social. Um sistema inteligente foi desenvolvido para tornar um robô capaz de decidir, de forma autônoma, quais comportamentos emitir em função do estado emocional humano. Para isso, a primeira contribuição deste trabalho é uma arquitetura denominada Social Robotics Deep Q-Network (SocialDQN) é proposta para ensinar robôs sociais a se comportarem e interagirem adequadamente com humanos com base em sinais sociais, especialmente em estados emocionais humanos. Ela oferece um arcabouço para a utilização de sinais sociais visando controlar as ações do robô e seu aprendizado é realizado por meio de Deep Reinforcement Learning(DRL). Uma segunda contribuição é o simulador SimDRLSR, que é o primeiro simulador a prover uma ferramenta para modelar humanos e seus comportamentos por meio de sinais sociais. O desenvolvimento e validação da rede SocialDQN foram realizados com o apoio desse simulador. Os resultados obtidos em diversos testes realizados em ambiente real demonstraram que o sistema aprendeu satisfatoriamente a maximizar as recompensas e, consequentemente, o robô se comportou de forma socialmente aceitável.
id USP_49385e833d43a2043f89789ba1c6a322
oai_identifier_str oai:teses.usp.br:tde-28022023-104023
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str 2721
spelling Aprendizado por reforço profundo para robótica social usando sinais sociais e emoções faciaisDeep reinforcement learning for social robotics using social signals and facial emotions.Aprendizado por reforço profundoDeep reinforcement learingEmoçõesEmotionsHuman-robot interactionInteração humano robôRobótica socialSimuladorSinais sociaisSocial roboticsSocial signsA robótica social representa um ramo da interação humano-robô dedicado ao desenvolvimento de sistemas para controlar os robôs para operar em ambientes não estruturados com a presença de seres humanos. Robôs sociais devem interagir com seres humanos entendendo sinais sociais e respondendo adequadamente a eles. A maioria dos robôs sociais ainda são pré-programados, não tendo grande capacidade de aprender e responder com ações adequadas durante uma interação com humanos. Métodos mais elaborados usam movimentos corporais, direção do olhar e linguagem corporal. Nesta tese os sinais socialmente aceitáveis comumente utilizados durante uma interação são considerados para o treinamento de um robô social. Um sistema inteligente foi desenvolvido para tornar um robô capaz de decidir, de forma autônoma, quais comportamentos emitir em função do estado emocional humano. Para isso, a primeira contribuição deste trabalho é uma arquitetura denominada Social Robotics Deep Q-Network (SocialDQN) é proposta para ensinar robôs sociais a se comportarem e interagirem adequadamente com humanos com base em sinais sociais, especialmente em estados emocionais humanos. Ela oferece um arcabouço para a utilização de sinais sociais visando controlar as ações do robô e seu aprendizado é realizado por meio de Deep Reinforcement Learning(DRL). Uma segunda contribuição é o simulador SimDRLSR, que é o primeiro simulador a prover uma ferramenta para modelar humanos e seus comportamentos por meio de sinais sociais. O desenvolvimento e validação da rede SocialDQN foram realizados com o apoio desse simulador. Os resultados obtidos em diversos testes realizados em ambiente real demonstraram que o sistema aprendeu satisfatoriamente a maximizar as recompensas e, consequentemente, o robô se comportou de forma socialmente aceitável.Social robotics represents a branch of human-robot interaction dedicated to developing systems to control robots to operate in unstructured environments in the presence of humans. Social robots must interact with humans by understanding social signals and responding appropriately. Most social robots are still pre-programmed, unable to learn and respond with appropriate actions during an interaction with humans. More elaborate methods use body movements, gaze direction, and body language. In this thesis, the socially acceptable signals commonly used during an interaction are considered for the training of a social robot. An intelligent system was developed to make a robot capable of autonomously deciding which behaviors to emit depending on the human emotional state. For this, the first contribution of this work is an architecture called Social Robotics Deep Q-Network (SocialDQN) is proposed to teach social robots to behave and interact appropriately with humans based on social signals, especially in human emotional states. It offers a framework for the use of social signals to control the robots actions and its learning is carried out through Deep Reinforcement Learning (DRL). A second contribution is the SimDRLSR simulator, which is the first simulator to provide a tool to model humans and their behavior through social signals. The development and validation of the SocialDQN network were carried out with the support of this simulator. The results obtained in several tests carried out in a real environment showed that the system learned satisfactorily to maximize rewards and, consequently, the robot behaved in a socially acceptable way.Biblioteca Digitais de Teses e Dissertações da USPRomero, Roseli Aparecida FrancelinBelo, José Pedro Ribeiro2022-12-15info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/55/55134/tde-28022023-104023/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2023-02-28T14:01:48Zoai:teses.usp.br:tde-28022023-104023Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212023-02-28T14:01:48Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Aprendizado por reforço profundo para robótica social usando sinais sociais e emoções faciais
Deep reinforcement learning for social robotics using social signals and facial emotions.
title Aprendizado por reforço profundo para robótica social usando sinais sociais e emoções faciais
spellingShingle Aprendizado por reforço profundo para robótica social usando sinais sociais e emoções faciais
Belo, José Pedro Ribeiro
Aprendizado por reforço profundo
Deep reinforcement learing
Emoções
Emotions
Human-robot interaction
Interação humano robô
Robótica social
Simulador
Sinais sociais
Social robotics
Social signs
title_short Aprendizado por reforço profundo para robótica social usando sinais sociais e emoções faciais
title_full Aprendizado por reforço profundo para robótica social usando sinais sociais e emoções faciais
title_fullStr Aprendizado por reforço profundo para robótica social usando sinais sociais e emoções faciais
title_full_unstemmed Aprendizado por reforço profundo para robótica social usando sinais sociais e emoções faciais
title_sort Aprendizado por reforço profundo para robótica social usando sinais sociais e emoções faciais
author Belo, José Pedro Ribeiro
author_facet Belo, José Pedro Ribeiro
author_role author
dc.contributor.none.fl_str_mv Romero, Roseli Aparecida Francelin
dc.contributor.author.fl_str_mv Belo, José Pedro Ribeiro
dc.subject.por.fl_str_mv Aprendizado por reforço profundo
Deep reinforcement learing
Emoções
Emotions
Human-robot interaction
Interação humano robô
Robótica social
Simulador
Sinais sociais
Social robotics
Social signs
topic Aprendizado por reforço profundo
Deep reinforcement learing
Emoções
Emotions
Human-robot interaction
Interação humano robô
Robótica social
Simulador
Sinais sociais
Social robotics
Social signs
description A robótica social representa um ramo da interação humano-robô dedicado ao desenvolvimento de sistemas para controlar os robôs para operar em ambientes não estruturados com a presença de seres humanos. Robôs sociais devem interagir com seres humanos entendendo sinais sociais e respondendo adequadamente a eles. A maioria dos robôs sociais ainda são pré-programados, não tendo grande capacidade de aprender e responder com ações adequadas durante uma interação com humanos. Métodos mais elaborados usam movimentos corporais, direção do olhar e linguagem corporal. Nesta tese os sinais socialmente aceitáveis comumente utilizados durante uma interação são considerados para o treinamento de um robô social. Um sistema inteligente foi desenvolvido para tornar um robô capaz de decidir, de forma autônoma, quais comportamentos emitir em função do estado emocional humano. Para isso, a primeira contribuição deste trabalho é uma arquitetura denominada Social Robotics Deep Q-Network (SocialDQN) é proposta para ensinar robôs sociais a se comportarem e interagirem adequadamente com humanos com base em sinais sociais, especialmente em estados emocionais humanos. Ela oferece um arcabouço para a utilização de sinais sociais visando controlar as ações do robô e seu aprendizado é realizado por meio de Deep Reinforcement Learning(DRL). Uma segunda contribuição é o simulador SimDRLSR, que é o primeiro simulador a prover uma ferramenta para modelar humanos e seus comportamentos por meio de sinais sociais. O desenvolvimento e validação da rede SocialDQN foram realizados com o apoio desse simulador. Os resultados obtidos em diversos testes realizados em ambiente real demonstraram que o sistema aprendeu satisfatoriamente a maximizar as recompensas e, consequentemente, o robô se comportou de forma socialmente aceitável.
publishDate 2022
dc.date.none.fl_str_mv 2022-12-15
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/55/55134/tde-28022023-104023/
url https://www.teses.usp.br/teses/disponiveis/55/55134/tde-28022023-104023/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1815257426321997824