O desempenho de ratos em jogo estratégico e os efeitos da modulação dopaminérgica
Autor(a) principal: | |
---|---|
Data de Publicação: | 2011 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da USP |
Texto Completo: | http://www.teses.usp.br/teses/disponiveis/41/41135/tde-21092011-084317/ |
Resumo: | A interação entre agentes inteligentes na disputa por recursos necessários à sobrevivência é um fato onipresente na luta pela vida. Este tipo de interação é estudado e formalizado matematicamente pela teoria dos jogos. Na literatura experimental encontramos vários estudos envolvendo primatas humanos e não humanos em tarefas de jogos estratégicos, mas, até o momento, não foi desenvolvido nenhum modelo deste comportamento com roedores. Estudos do comportamento animal mostram que estes aprendem e aprimoram este tipo de estratégias através de aprendizagem por reforço. O elemento central dos modelos computacionais de aprendizado por reforço é o sinal de violação de expectativa, que sinaliza o quanto um resultado difere, para mais ou para menos, do esperado. Este sinal é utilizado pelo agente para atualização dos valores e, assim, da probabilidade de escolha das opções. A pesquisa neurofisiológica tem consistentemente demonstrado que o sinal fásico emitido pelo sistema dopaminérgico conforma-se muito de perto às características do sinal descrito pela teoria computacional. Dessa maneira, os objetivos do presente estudo são pesquisar (1) se roedores são capazes de jogar um jogo estratégico simples e se a evolução do seu desempenho é consistente com o aprendizado por reforço e (2) se os efeitos de agonistas e antagonistas dopaminérgicos na estratégia de jogo são consistentes com a teoria segundo a qual o sinal dopaminérgico fásico desempenha função central na atualização constante da estratégia de jogo. Nossos resultados demonstram que, neste jogo estratégico, roedores efetivamente são capazes de um desempenho muito próximo do normativo, que seu desempenho é consistente com o aprendizado por reforço e, finalmente, que o sistema dopaminérgico está envolvido no processo de atualização da estratégia. |
id |
USP_9c39b58ab36db89e041c8a0bc6f5fc09 |
---|---|
oai_identifier_str |
oai:teses.usp.br:tde-21092011-084317 |
network_acronym_str |
USP |
network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
repository_id_str |
2721 |
spelling |
O desempenho de ratos em jogo estratégico e os efeitos da modulação dopaminérgicaPerformance of rats in a strategic game and dopaminergic modulation of their choice policyDecision makingNeuromodulaçãoNeuromodulationTomada de decisãoA interação entre agentes inteligentes na disputa por recursos necessários à sobrevivência é um fato onipresente na luta pela vida. Este tipo de interação é estudado e formalizado matematicamente pela teoria dos jogos. Na literatura experimental encontramos vários estudos envolvendo primatas humanos e não humanos em tarefas de jogos estratégicos, mas, até o momento, não foi desenvolvido nenhum modelo deste comportamento com roedores. Estudos do comportamento animal mostram que estes aprendem e aprimoram este tipo de estratégias através de aprendizagem por reforço. O elemento central dos modelos computacionais de aprendizado por reforço é o sinal de violação de expectativa, que sinaliza o quanto um resultado difere, para mais ou para menos, do esperado. Este sinal é utilizado pelo agente para atualização dos valores e, assim, da probabilidade de escolha das opções. A pesquisa neurofisiológica tem consistentemente demonstrado que o sinal fásico emitido pelo sistema dopaminérgico conforma-se muito de perto às características do sinal descrito pela teoria computacional. Dessa maneira, os objetivos do presente estudo são pesquisar (1) se roedores são capazes de jogar um jogo estratégico simples e se a evolução do seu desempenho é consistente com o aprendizado por reforço e (2) se os efeitos de agonistas e antagonistas dopaminérgicos na estratégia de jogo são consistentes com a teoria segundo a qual o sinal dopaminérgico fásico desempenha função central na atualização constante da estratégia de jogo. Nossos resultados demonstram que, neste jogo estratégico, roedores efetivamente são capazes de um desempenho muito próximo do normativo, que seu desempenho é consistente com o aprendizado por reforço e, finalmente, que o sistema dopaminérgico está envolvido no processo de atualização da estratégia.Intelligent agents competing for the resources necessary for survival is a universal factor in the struggle for life. This type of interaction has been studied and mathematically formalized by game theory. In scientific literature we have come across several studies involving human and non-human primates carrying out strategic game tasks; however, until now, no model for such behavior has been developed for rodents. Animal behavior studies have shown that animals learn and develop strategies through reinforcement learning. A central element of computational models of reinforcement learning is the reward-prediction error signal, which indicates how much a result differs, either positively or negatively, from the expected result. This signal is used by the agent to update the values of its options, and so their probability of being chosen. Neurophysiologic research has consistently shown that the phasic signal emitted by the dopamine system conforms very closely to the characteristics of the signal described by computational theory. The purposes of this study are: (1) to discover whether rodents are capable of playing a simple strategic game and whether the evolution of their performance is consistent with reinforcement learning; and (2) whether the effects of dopamine agonists and antagonists on game strategy are consistent with the theory that phasic dopamine signals have a primary role in the constant update of game strategy. Our results prove that, in this strategic game, rodents are effectively capable of finding a strategy that is very close to the normative one, that their performance is consistent with reinforcement learning and, finally, that the dopamine system is involved in the process of strategic updating.Biblioteca Digitais de Teses e Dissertações da USPXavier, Gilberto FernandoTassi, Luiz Eduardo2011-06-10info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttp://www.teses.usp.br/teses/disponiveis/41/41135/tde-21092011-084317/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2016-07-28T16:10:30Zoai:teses.usp.br:tde-21092011-084317Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212016-07-28T16:10:30Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
dc.title.none.fl_str_mv |
O desempenho de ratos em jogo estratégico e os efeitos da modulação dopaminérgica Performance of rats in a strategic game and dopaminergic modulation of their choice policy |
title |
O desempenho de ratos em jogo estratégico e os efeitos da modulação dopaminérgica |
spellingShingle |
O desempenho de ratos em jogo estratégico e os efeitos da modulação dopaminérgica Tassi, Luiz Eduardo Decision making Neuromodulação Neuromodulation Tomada de decisão |
title_short |
O desempenho de ratos em jogo estratégico e os efeitos da modulação dopaminérgica |
title_full |
O desempenho de ratos em jogo estratégico e os efeitos da modulação dopaminérgica |
title_fullStr |
O desempenho de ratos em jogo estratégico e os efeitos da modulação dopaminérgica |
title_full_unstemmed |
O desempenho de ratos em jogo estratégico e os efeitos da modulação dopaminérgica |
title_sort |
O desempenho de ratos em jogo estratégico e os efeitos da modulação dopaminérgica |
author |
Tassi, Luiz Eduardo |
author_facet |
Tassi, Luiz Eduardo |
author_role |
author |
dc.contributor.none.fl_str_mv |
Xavier, Gilberto Fernando |
dc.contributor.author.fl_str_mv |
Tassi, Luiz Eduardo |
dc.subject.por.fl_str_mv |
Decision making Neuromodulação Neuromodulation Tomada de decisão |
topic |
Decision making Neuromodulação Neuromodulation Tomada de decisão |
description |
A interação entre agentes inteligentes na disputa por recursos necessários à sobrevivência é um fato onipresente na luta pela vida. Este tipo de interação é estudado e formalizado matematicamente pela teoria dos jogos. Na literatura experimental encontramos vários estudos envolvendo primatas humanos e não humanos em tarefas de jogos estratégicos, mas, até o momento, não foi desenvolvido nenhum modelo deste comportamento com roedores. Estudos do comportamento animal mostram que estes aprendem e aprimoram este tipo de estratégias através de aprendizagem por reforço. O elemento central dos modelos computacionais de aprendizado por reforço é o sinal de violação de expectativa, que sinaliza o quanto um resultado difere, para mais ou para menos, do esperado. Este sinal é utilizado pelo agente para atualização dos valores e, assim, da probabilidade de escolha das opções. A pesquisa neurofisiológica tem consistentemente demonstrado que o sinal fásico emitido pelo sistema dopaminérgico conforma-se muito de perto às características do sinal descrito pela teoria computacional. Dessa maneira, os objetivos do presente estudo são pesquisar (1) se roedores são capazes de jogar um jogo estratégico simples e se a evolução do seu desempenho é consistente com o aprendizado por reforço e (2) se os efeitos de agonistas e antagonistas dopaminérgicos na estratégia de jogo são consistentes com a teoria segundo a qual o sinal dopaminérgico fásico desempenha função central na atualização constante da estratégia de jogo. Nossos resultados demonstram que, neste jogo estratégico, roedores efetivamente são capazes de um desempenho muito próximo do normativo, que seu desempenho é consistente com o aprendizado por reforço e, finalmente, que o sistema dopaminérgico está envolvido no processo de atualização da estratégia. |
publishDate |
2011 |
dc.date.none.fl_str_mv |
2011-06-10 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://www.teses.usp.br/teses/disponiveis/41/41135/tde-21092011-084317/ |
url |
http://www.teses.usp.br/teses/disponiveis/41/41135/tde-21092011-084317/ |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
|
dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.coverage.none.fl_str_mv |
|
dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
instname_str |
Universidade de São Paulo (USP) |
instacron_str |
USP |
institution |
USP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
collection |
Biblioteca Digital de Teses e Dissertações da USP |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
_version_ |
1815257249247920128 |