Dilema do prisioneiro contínuo com agentes racionais e classificadores de cooperação
Autor(a) principal: | |
---|---|
Data de Publicação: | 2012 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da USP |
Texto Completo: | http://www.teses.usp.br/teses/disponiveis/59/59135/tde-08012013-222525/ |
Resumo: | O dilema do prisioneiro (DP) é um dos principais jogos da teoria dos jogos. No dilema do prisioneiro discreto (DPD), dois prisioneiros têm as opções de cooperar ou desertar. Um jogador cooperador não delata seu comparsa, já um desertor delata. Se um cooperar e o outro desertar, o cooperador fica preso por cinco anos e o desertor fica livre. Se ambos cooperarem, ficam presos por um ano e, se ambos desertarem, ficam presos por três anos. Quando o DP é repetido, a cooperação pode emergir entre agentes egoístas. Realizamos um estudo analítico para o DPD, que produziu uma formulação da evolução do nível médio de cooperação e da tentação crítica (valor de tentação que causa mudança abrupta do nível de cooperação). No dilema do prisioneiro contínuo (DPC), cada jogador apresenta um nível de cooperação que define o grau de cooperação. Utilizamos o DPC para estudar o efeito da personalidade dos jogadores sobre a emergência da cooperação. Para isso, propusemos novas estratégias: uma baseada na personalidade dos jogadores e outras duas baseadas na comparação entre o ganho obtido e a aspiração do jogador. Todas as estratégias apresentavam algum mecanismo de cópia do estado do vizinho com maior ganho na vizinhança, mecanismo este, herdado da estratégia darwiniana. Os resultados mostraram que o DPC aumenta o nível médio de cooperação do sistema, quando comparado ao DPD. No entanto, as diferentes estratégias não aumentaram a cooperação comparado à cooperação obtida com a estratégia darwiniana. Então propusemos o uso do coeficiente de agrupamentos, coeficiente de Gini e entropias de Shannon, Tsallis e Kullback-Leibler para classificar os sistemas, em que os agentes jogam o DPD com a estratégia darwiniana, quanto ao nível de cooperação. Como analisamos valores de médias configuracionais, tais classificadores não foram eficientes ao classificar os sistemas. Isso é consequência da existência de distribuições de extremos nos resultados que compõem as médias. As distribuições de extremos suscitaram uma discussão acerca da definição do regime de cooperação no dilema do prisioneiro. Discutimos também as consequências de utilizar apenas valores médios nos resultados ignorando seus desvios e as distribuições. |
id |
USP_64f311b9fdd097f5f70e964ddb6e3106 |
---|---|
oai_identifier_str |
oai:teses.usp.br:tde-08012013-222525 |
network_acronym_str |
USP |
network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
repository_id_str |
2721 |
spelling |
Dilema do prisioneiro contínuo com agentes racionais e classificadores de cooperaçãoContinuous prisoners dilemma with rational agents and cooperation classifiers.aversão ao riscocluster entropycoeficiente de Ginicontinuous prisoners dilemmacooperaçãocooperationdarwinian strategydilema do prisioneirodilema do prisioneiro contínuoeconofísica.econophysics.entropia de agrupamentoestratégia darwinianaestratégia pavlovianagame theoryGini coefficientpavlovian strategyprisoners dilemmarisk aversionteoria dos jogosO dilema do prisioneiro (DP) é um dos principais jogos da teoria dos jogos. No dilema do prisioneiro discreto (DPD), dois prisioneiros têm as opções de cooperar ou desertar. Um jogador cooperador não delata seu comparsa, já um desertor delata. Se um cooperar e o outro desertar, o cooperador fica preso por cinco anos e o desertor fica livre. Se ambos cooperarem, ficam presos por um ano e, se ambos desertarem, ficam presos por três anos. Quando o DP é repetido, a cooperação pode emergir entre agentes egoístas. Realizamos um estudo analítico para o DPD, que produziu uma formulação da evolução do nível médio de cooperação e da tentação crítica (valor de tentação que causa mudança abrupta do nível de cooperação). No dilema do prisioneiro contínuo (DPC), cada jogador apresenta um nível de cooperação que define o grau de cooperação. Utilizamos o DPC para estudar o efeito da personalidade dos jogadores sobre a emergência da cooperação. Para isso, propusemos novas estratégias: uma baseada na personalidade dos jogadores e outras duas baseadas na comparação entre o ganho obtido e a aspiração do jogador. Todas as estratégias apresentavam algum mecanismo de cópia do estado do vizinho com maior ganho na vizinhança, mecanismo este, herdado da estratégia darwiniana. Os resultados mostraram que o DPC aumenta o nível médio de cooperação do sistema, quando comparado ao DPD. No entanto, as diferentes estratégias não aumentaram a cooperação comparado à cooperação obtida com a estratégia darwiniana. Então propusemos o uso do coeficiente de agrupamentos, coeficiente de Gini e entropias de Shannon, Tsallis e Kullback-Leibler para classificar os sistemas, em que os agentes jogam o DPD com a estratégia darwiniana, quanto ao nível de cooperação. Como analisamos valores de médias configuracionais, tais classificadores não foram eficientes ao classificar os sistemas. Isso é consequência da existência de distribuições de extremos nos resultados que compõem as médias. As distribuições de extremos suscitaram uma discussão acerca da definição do regime de cooperação no dilema do prisioneiro. Discutimos também as consequências de utilizar apenas valores médios nos resultados ignorando seus desvios e as distribuições.Prisoner\'s dilemma (PD) is one of the main games of game theory. In discrete prisoner\'s dilemma (DPD), two prisoners have the options to cooperate or to defect. A cooperator player does not defect his accomplice, while a defector does. If one player cooperates and the other defects, the cooperator gets jailed for five years and the defector goes free. If both cooperate, they get jailed during one year and if both defect, they get jailed during three years. When this game is repeated, cooperation may emerge among selfish individuals. We perform an analytical study for the DPD, that produced a formulation for the evolution of the mean cooperation level and for the critical temptation values (temptation values that promote abrupt modifications in the cooperation level). In continuous prisoner\'s dilemma (CPD), each player has a level of cooperation that defines his/her degree of cooperation. We used the CPD to study the effect of the players\' personality on the emergence of cooperation. For this, we propose new strategies: one based on the players\' personality and two others based on the comparison between the player\'s obtained payoff and the desire one. All strategies present some mechanism that copies the state of the neighbor with the highest payoff in the neighborhood, mechanism inherited from the Darwinian strategy. The results showed that the CPD increases the average cooperation level of the system when compared to DPD. However, different strategies do not increased the cooperation compared to cooperation obtained with the Darwinian strategy. So, we propose the use of cluster coefficient, Gini coefficient and entropy of Shannon, Tsallis and Kullback-Leibler as classifiers to classify systems, in which the individuals play DPD with Darwinian strategy, by the cooperation level. As configurational averages were analyzed, such classifiers were not efficient in classifying the systems. This is due to the existence of distributions with extreme values of the results that compose the means. Distributions with extremes values emerged a discussion about the definition of the cooperation state in the prisoner\'s dilemma. We also discussed the consequences of using only average results in the analysis ignoring their deviations and distributions.Biblioteca Digitais de Teses e Dissertações da USPMartinez, Alexandre SoutoPereira, Marcelo Alves2012-11-23info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttp://www.teses.usp.br/teses/disponiveis/59/59135/tde-08012013-222525/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2016-07-28T16:10:35Zoai:teses.usp.br:tde-08012013-222525Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212016-07-28T16:10:35Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
dc.title.none.fl_str_mv |
Dilema do prisioneiro contínuo com agentes racionais e classificadores de cooperação Continuous prisoners dilemma with rational agents and cooperation classifiers. |
title |
Dilema do prisioneiro contínuo com agentes racionais e classificadores de cooperação |
spellingShingle |
Dilema do prisioneiro contínuo com agentes racionais e classificadores de cooperação Pereira, Marcelo Alves aversão ao risco cluster entropy coeficiente de Gini continuous prisoners dilemma cooperação cooperation darwinian strategy dilema do prisioneiro dilema do prisioneiro contínuo econofísica. econophysics. entropia de agrupamento estratégia darwiniana estratégia pavloviana game theory Gini coefficient pavlovian strategy prisoners dilemma risk aversion teoria dos jogos |
title_short |
Dilema do prisioneiro contínuo com agentes racionais e classificadores de cooperação |
title_full |
Dilema do prisioneiro contínuo com agentes racionais e classificadores de cooperação |
title_fullStr |
Dilema do prisioneiro contínuo com agentes racionais e classificadores de cooperação |
title_full_unstemmed |
Dilema do prisioneiro contínuo com agentes racionais e classificadores de cooperação |
title_sort |
Dilema do prisioneiro contínuo com agentes racionais e classificadores de cooperação |
author |
Pereira, Marcelo Alves |
author_facet |
Pereira, Marcelo Alves |
author_role |
author |
dc.contributor.none.fl_str_mv |
Martinez, Alexandre Souto |
dc.contributor.author.fl_str_mv |
Pereira, Marcelo Alves |
dc.subject.por.fl_str_mv |
aversão ao risco cluster entropy coeficiente de Gini continuous prisoners dilemma cooperação cooperation darwinian strategy dilema do prisioneiro dilema do prisioneiro contínuo econofísica. econophysics. entropia de agrupamento estratégia darwiniana estratégia pavloviana game theory Gini coefficient pavlovian strategy prisoners dilemma risk aversion teoria dos jogos |
topic |
aversão ao risco cluster entropy coeficiente de Gini continuous prisoners dilemma cooperação cooperation darwinian strategy dilema do prisioneiro dilema do prisioneiro contínuo econofísica. econophysics. entropia de agrupamento estratégia darwiniana estratégia pavloviana game theory Gini coefficient pavlovian strategy prisoners dilemma risk aversion teoria dos jogos |
description |
O dilema do prisioneiro (DP) é um dos principais jogos da teoria dos jogos. No dilema do prisioneiro discreto (DPD), dois prisioneiros têm as opções de cooperar ou desertar. Um jogador cooperador não delata seu comparsa, já um desertor delata. Se um cooperar e o outro desertar, o cooperador fica preso por cinco anos e o desertor fica livre. Se ambos cooperarem, ficam presos por um ano e, se ambos desertarem, ficam presos por três anos. Quando o DP é repetido, a cooperação pode emergir entre agentes egoístas. Realizamos um estudo analítico para o DPD, que produziu uma formulação da evolução do nível médio de cooperação e da tentação crítica (valor de tentação que causa mudança abrupta do nível de cooperação). No dilema do prisioneiro contínuo (DPC), cada jogador apresenta um nível de cooperação que define o grau de cooperação. Utilizamos o DPC para estudar o efeito da personalidade dos jogadores sobre a emergência da cooperação. Para isso, propusemos novas estratégias: uma baseada na personalidade dos jogadores e outras duas baseadas na comparação entre o ganho obtido e a aspiração do jogador. Todas as estratégias apresentavam algum mecanismo de cópia do estado do vizinho com maior ganho na vizinhança, mecanismo este, herdado da estratégia darwiniana. Os resultados mostraram que o DPC aumenta o nível médio de cooperação do sistema, quando comparado ao DPD. No entanto, as diferentes estratégias não aumentaram a cooperação comparado à cooperação obtida com a estratégia darwiniana. Então propusemos o uso do coeficiente de agrupamentos, coeficiente de Gini e entropias de Shannon, Tsallis e Kullback-Leibler para classificar os sistemas, em que os agentes jogam o DPD com a estratégia darwiniana, quanto ao nível de cooperação. Como analisamos valores de médias configuracionais, tais classificadores não foram eficientes ao classificar os sistemas. Isso é consequência da existência de distribuições de extremos nos resultados que compõem as médias. As distribuições de extremos suscitaram uma discussão acerca da definição do regime de cooperação no dilema do prisioneiro. Discutimos também as consequências de utilizar apenas valores médios nos resultados ignorando seus desvios e as distribuições. |
publishDate |
2012 |
dc.date.none.fl_str_mv |
2012-11-23 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://www.teses.usp.br/teses/disponiveis/59/59135/tde-08012013-222525/ |
url |
http://www.teses.usp.br/teses/disponiveis/59/59135/tde-08012013-222525/ |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
|
dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.coverage.none.fl_str_mv |
|
dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
instname_str |
Universidade de São Paulo (USP) |
instacron_str |
USP |
institution |
USP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
collection |
Biblioteca Digital de Teses e Dissertações da USP |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
_version_ |
1815256551695319040 |