跳转到主要内容

原始研究的文章

前面。理论物理。,29日January 2019
秒。跨学科物理
卷6 - 2018 | https://doi.org/10.3389/fphy.2018.00156

罕见的第三方惩罚促进合作风险社会学习动力

  • 组织研究和知识产权的战略协作,明治大学,东京,日本

第三方惩罚是一种常见的机制来促进合作。合作演化理论模型预测,惩罚保持合作,如果非常频繁。另一方面,实证研究发现,参与者经常惩罚别人不成功相比,那些不急于惩罚他人,这表明惩罚是次优的,因此不应频繁。情况就是这样,我们的问题是机制,如果有的话,可以维持合作,即使惩罚是罕见的。本研究提出一种可能的机制是规避风险的社会学习。利用进化博弈动力学的方法,我们调查的个体风险态度的影响问题。在我们的框架中,个人选择一个策略基于其风险,即。回报的方差,以及它的预期收益;规避风险的个体倾向于选择一个策略变量较低的回报。使用这个框架,我们检查两人合作的进化的社会困境游戏惩罚。我们研究两种模型:合作者和叛逃者竞争,虽然叛逃者处罚由外生权威; and cooperators, defectors, and cooperative punishers compete, while defectors may be punished by the cooperative punishers. We find that in both models, risk-averse individuals achieve stable cooperation with significantly low frequency of punishment. We also examine three punishment variants: in each game, all defectors are punished; only one of defectors is punished; and only a defector who exploits a cooperator or a cooperative punisher is punished. We find that the first and second variants effectively promote cooperation. Comparing the first and second variants, each can be more effective than the other depending on punishment frequency.

1。介绍

合作是观察在不同的物种,尽管似乎不宜在自私的看法1- - - - - -3]。,人类合作是独一无二的,因为他们执行自己通过社会规范和合作机构:由社区成员规范违反者将受到惩罚,因此合作是维护(4- - - - - -10]。在人类的合作,惩罚者通常是一个第三方不直接遭受违反规范。从理性的角度,第三方惩罚者没有动机来惩罚规范违反者以个人的成本(7,8];因此,第三方惩罚是合作的另一个难题6,10- - - - - -12]。尽管如此,实证研究表明,第三方惩罚无处不在在人类[8,13]。

许多进化模型提出了解决第三方惩罚的困境:群体选择(14],名声一个信号诱导他人合作向惩罚者(15),所在社会结构相互作用[16,17),墨守成规的偏见,大多数策略是模仿在社会学习18),一个选项来选择退出联合企业(12,19),二阶惩罚(20.,21),承诺合作之前玩游戏(22],与惩罚的成员在同一组做坏事的人也受到惩罚(23]。在所有的模型中,惩罚应该足够频繁保持合作。另一方面,实验室研究发现,参与者经常从事惩罚不成功相比,那些不渴望执行惩罚,这表明惩罚别人过于频繁是不适应的24,25]。如果是这样,如何保持合作,只有偶尔的第三方惩罚吗?

在这项研究中,我们提出一个想法,促进合作,即使第三方惩罚是rare-risk厌恶。一个明显的心理事实是违反规范是一个危险的选择:它可能引发愤怒的社区成员可能导致实际执行惩罚规范违反者[26]。事实上,公开处决是常见的在前现代社会,统治者以引起恐惧提交规范违反。此外,实验研究表明,仅仅是惩罚的威胁可以促进合作27,28]。

将风险与进化心理学游戏,我们扩展规范进化游戏动态风险敏感性效用函数,它可以描述易发和规避风险的策略选择。总结我们的研究结果,风险厌恶情绪促进合作一些第三方的惩罚。

2。权威的第三方惩罚

我们首先介绍一个简单的模型的合作者之间的竞争和叛逃者无限,混合人口,叛逃者的概率被第三方权威。不时地,随机抽样两个人玩一个社会困境游戏叫做弱囚徒困境游戏(29日),玩家有两种选择:合作(C)和背叛(D)。由其支付矩阵

C D C D ( 1 0 T 0 ] , ( 1 )

在哪里<我>T>1。在这个游戏中,相互合作提供回报1这两名球员,而他们享受的诱惑片面的背叛,因为它提供了更好的回报<我>T(>1)。然而,每个游戏观察到一个权威的第三方惩罚者的概率<我>z,选择了背叛的人罚款的金额<我>F(>0)。据复制因子人口的发展动态30.,31日]。

2.1。进化稳定的合作伙伴

在这里,我们考虑进化稳定人口单型的合作者对入侵的叛逃者。我们的发现是,风险厌恶情绪的个人所需的低频率的观察来维持合作;权威的惩罚成本显著低于中性理论的预测。

普通进化游戏动力学假设玩家改变策略基于他们预期回报。让我们考虑我们的模型在这条直线上。单型的合作者的人口,居民合作者的预期收益是他们相互合作和突变的叛逃者<我>T−<我>zF他们喜欢和概率片面的背叛而受到惩罚<我>z。因此,合作者的人口对入侵的进化稳定的叛逃者,即。ESS,如果1 ><我>T−<我>zF,也就是说,

z > T - - - - - - 1 F = : z 中性 * ( 2 )

所需的观测概率的下确界, z 中性 * ,是一个幂函数的好,<我>F;也就是说, z 中性 * F - - - - - - 1 (虚线图1)。这意味着即使权威对叛逃者重的罚款,维持合作,权力需要惩罚叛逃者经常;保持合作的成本应该是相当大的。

图1
www.雷竞技rebatfrontiersin.org

图1。所需的观测概率的下确界的权威来维持合作:个人风险newtral(虚线; z 中性 * β= 0),风险厌恶(实线; z 有偏见的 * β=−1),或风险倾向(虚线; z 有偏见的 * β= 1)。红色的点划的线代表了渐近 z 有偏见的 * 与β= 1是收敛的。参数:<我>T=2。

我们延长普通理论假设球员改变策略根据他们的效用。考虑到使用策略<我>年代结果在一个随机回报由随机变量表示<我>R<年代ub><我>年代(的实现<我>R<年代ub><我>年代 R 年代 ( ) 的概率 p 年代 ( ) 在哪里<我>我显示每个结果),其效用的定义

u 年代 = 1 β 日志 ( e β R 年代 ] , ( 3 )

在哪里 ( e β R 年代 ] = p 年代 ( ) e β R 年代 ( ) 表示随机变量的期望值 e β R 年代 。方程(3)是一个著名的指数效用函数由普拉特(32),霍华德和马西森(33],Coraluppi和马库斯[34]和Mihatsch Neuneier [35]。它可以扩展

( R 年代 ] + β 2 Var ( R 年代 ] + O ( β 2 ) , ( 4 )

其中第一项是回报的期望值和第二项的方差成正比的回报。因此,如果<我>β=0,效用等于期望值,这意味着风险中性效用;如果<我>β<0,该实用程序是减少了第二项,暗示规避风险的工具,一个人发现一个策略比如果它产生一个高度可变的回报;如果<我>β>0,效用是增加了第二项,这意味着较大的效用的个人发现策略更可取的如果它产生一个高度可变的回报。

风险规避或倾向(即。,如果<我>β≠0)的合作者和效用的叛逃者,从方程(3),由

u C = 1 β 日志 ( 1 · e β · 1 ] = 1 ( 5 )

u D = 1 β 日志 ( z e β ( T - - - - - - F ) + ( 1 - - - - - - z ) e β T ] , ( 5 b )

分别。一个简单的计算导致ESS条件对应方程(2):<我>u<年代ub>C><我>u<年代ub>D,也就是说,

z > 1 - - - - - - e - - - - - - β ( T - - - - - - 1 ) 1 - - - - - - e - - - - - - β F =: z 有偏见的 * ( 6 )

请注意, lim β 0 z 有偏见的 * = z 中性 * 适用。如果β< 0,其渐近的形式是一个指数函数<我>F即: z 有偏见的 * e β F ——它迅速趋于0时<我>F增加(实线图1)。这意味着维护合作厌恶风险的人,权力需要惩罚只是偶尔叛逃者。普通理论相比,维持合作应大大减少昂贵的成本。如果β> 0, z 有偏见的 * 方法1−e<年代up>−<我>β(<我>T−1)(>0)<我>F增加;需要经常惩罚(虚线图1)。

2.2。二态性的合作者和叛逃者

如果方程(2)或(6)违反,叛逃者入侵合作者的人口。在那之后,他们可能会与合作者建立稳定的双晶的人口。在这里,我们研究个体风险态度的影响这样的二态性。我们发现风险规避合作者的频率增加。此外,我们引入三个变体相关的惩罚二态性:(a)惩罚所有的叛逃者(最昂贵的);(b)惩罚一个警告他人比变体(a)][成本更低;或(c)惩罚只片面的叛逃者(便宜)。我们发现第一次和第二次变异但第三个实现合作的二态性。令人惊讶的是,第一个变体可以最具成本效益的解决方案来维持合作的可能性相当小的观察。

不同的情况下单型性(2.1节)所背叛突变总是向居民合作伙伴,相互背叛两个叛逃者还可能在二态性。因此,问题在于如何应第三方权威治疗相互背叛?应该权力惩罚两个逃亡者?这可能是过于昂贵。惩罚只是其中的一个警告其他人抑制将来背叛吗?这是成本更低的但可能是不够的。作为两个叛逃者获得任何相互背叛,惩罚他们?为此,我们考虑不同的三个变体规则相互背叛(图2):(a)权力惩罚所有的背叛者;(b)的权力惩罚叛逃者随机选择之一;和(c)权力惩罚只是一个片面的叛逃者,叛逃者都受到惩罚。以后,我们称之为一个,分别和片面的变体。

图2
www.雷竞技rebatfrontiersin.org

图2。三个变种的第三方惩罚。空白的圆圈代表球员和那些“P”代表处罚者作为观察员。连接每一行空白圈,上面“D D”或“D C”,代表共同背叛或片面的背叛在游戏中,分别。箭头表示执行惩罚。<年代trong>(一)脱北者受到惩罚:相互背叛,惩罚者支付成本2<我>C每个两个叛逃者支付罚款<我>F。<年代trong>(B)只有一个叛逃者的惩罚:相互背叛,惩罚者支付成本<我>C其中一个两个叛逃者,随机选择,支付罚款<我>F。<年代trong>(C)只是一个片面的叛逃者惩罚:惩罚者并不关心相互背叛。在所有的三个变体,惩罚者支付成本<我>C和叛逃者支付罚款<我>F片面的背叛。

为每个变量与不同的风险态度,我们数值找到合作者的复制因子动态的稳定点和叛逃者,也就是说,

x ˙ = x ( 1 - - - - - - x ) ( u C - - - - - - u D ] , ( 7 )

在哪里<我>x合作者的频率,<我>u<年代ub>C和<我>u<年代ub>D是作为一个合作者的效用方程(A1)和作为一个叛逃者(A2)方程。所有和一个变体实现稳定的合作者和叛逃者(二态性图3 a, B)。在这些变异,小<我>β增加合作伙伴的稳定的频率。正如预期的那样,所有变体实现合作高于一个变体。并不能实现二态性,因为片面变体<我>u<年代ub>C><我>u<年代ub>D与方程(A1, A2c)相当于方程(6);一个稳定的人口在这个变体包括所有叛逃者如果ESS(即条件。方程2 - 6)是违反了。

图3
www.雷竞技rebatfrontiersin.org

图3。频率稳定的合作伙伴<年代trong>(A, B)和惩罚的预期数量的观察<年代trong>(C, D)在双晶的合作者和叛逃者人口如果方程(2)或(6)是违反了。<年代trong>(A, C)所有的变种。(b, d)的变体。<年代trong>(E)显示之间的区别<年代trong>(C, D)。个人风险newtral(虚线;<我>β=0),风险厌恶(实线;<我>β=−1),或风险倾向(虚线;<我>β=1)。参数:<我>T= 2,<我>F=1。

虽然所有变体达到更高的合作比的一种变体,权力可能惩罚defectors-thus支付更高的成本比所有变体的一个变体。这对规避风险的担忧是不必要的个人足够料想的合理小概率的观察,<我>z。鉴于合作者的稳定的频率<我>x*,观察权威的概率找到片面的背叛是2<我>x*(1−<我>x*)和(1−找到相互背叛<我>x*)<年代up>2。因此,惩罚的预期数量每观察所有变体是2<我>x*(1−<我>x*)×1 + (1−<我>x*)<年代up>2×2 = 2 (1−<我>x*)和一种变体,是2<我>x*(1−<我>x*)×1 + (1−<我>x*)<年代up>2×1 = 1−<我>x*<年代up>2——第一眼,前者大于后者。自<我>x*在所有变异大于(见一个变体图3 a, B),有效的惩罚/观察所有变体可以小于一个变体(图3 c, D情节,图3 e显示他们的区别)。如果个人风险厌恶,相当小<我>z使所有变体更便宜;也就是说,the branching point at which the sign of the difference changes becomes smaller as<我>β减少(在图3 e分支点的<我>β=−1位于周围<我>z= 0。15)。

3所示。内源性第三方惩罚

到目前为止,我们已经假定存在的惩罚者是一个外生的权威在种群动态。尽管这种假设似乎是合理的社会中一个成熟的机构权威的惩罚是存在的,小规模的社会如狩猎可能需要一个不同的场景。我们的下一个问题是如果没有任何<我>利维坦。我们的发现是,如果人不愿承担风险,它们的一些内源性第三方punishers-they人口动力学可以维持高合作发展。

在这里,我们考虑另一个合作者之间的竞争模型,叛逃者,内生第三方惩罚执行者。不时地,随机抽样三人参与情境:第二节,两个选择它们的random-play疲软的囚徒困境游戏;剩下的一个观察游戏,可以在成本惩罚每一个叛逃者<我>C(>0)。再一次,那些被惩罚支付罚款<我>F。合作伙伴选择C游戏什么也不做,如果被观察者;叛逃者中选择D游戏什么也不做,如果被观察者;和处罚者选择C在游戏和执行惩罚如果作为一个观察者和观察叛逃者。个人改变策略根据replicator-mutator动力学(36- - - - - -38)根据他们的风险敏感性工具(公式3),由

x ˙ = x f C ( 1 - - - - - - μ ) + y f D μ 2 + z f P μ 2 - - - - - - x f , ( 8 )
y ˙ = y f D ( 1 - - - - - - μ ) + z f P μ 2 + x f C μ 2 - - - - - - y f , ( 8 b )

z ˙ = z f P ( 1 - - - - - - μ ) + x f C μ 2 + y f D μ 2 - - - - - - z f , ( 8 c )

在哪里<我>x,<我>y,<我>z是合作者的频率,叛逃者,惩罚执行者,

f = x f C + y f D + z f P ( 9 )

是健身和平均

f 年代 = 1 - - - - - - w + w u 年代 ( 10 )

健身的策略<我>年代(=C,D,P)<我>u<年代ub><我>年代由方程(A3、A4)。在方程(8),μ是个体变异的概率他/她的策略,另一个偶然:不改变他/她的策略<我>年代以概率1−μ;否则,突变后他/她的策略的另一个策略<我>年代′(≠<我>年代与概率μ/ 2),2是其他策略的数量。在方程(10),<我>w(0≤<我>w≤1)是一个参数控制强度的选择;大(小)<我>w意味着强(弱)的选择。

作为我们的主要兴趣是不影响,我们修复<我>w在第三节= 0.1和μ= 0.01。我们的动机采用replicator-mutator动力学是(1)为了避免人工合作者之间的中性稳定和惩罚执行者的叛逃者不在场的时候,(2)把更多的现实模型在社会学习,人类常常随意探索不同的策略(39]。

我们数值分析每个变体的replicator-mutator动力学方程(8)与不同的风险态度。作为一个参考点,我们选择一组参数(<我>T= 2,<我>C= 1,<我>F= 3,<我>w= 0。1,和μ= 0。01)的叛逃者经常在人口风险中性(例如,<我>β=0)个人(图4胃肠道)。然后,我们检查参数变化的影响<我>β:随着极端风险规避(<我>β=−10),个人实现几乎全面合作(图4 a - c);另一方面,与极端风险倾向(<我>β=10),他们几乎达到完整的背叛(图4 m-o)。我们可以理解这两种极端情况下通过检查 lim β ± u 年代 为<我>年代=C,D,P(见附录B在补充材料):因为 lim β - - - - - - u C = 0 , lim β - - - - - - u D = - - - - - - F (所有和一个变种)<我>T−<我>F(片面的变体), lim β - - - - - - u P = - - - - - - 2 C (所有版本)或−<我>C(一个和片面的变体)的内部状态空间(B1a方程适用于方程A3、A4),合作者是最大的,如果个人的效用非常厌恶风险(如果<我>T<<我>F片面的变体);同样的,因为 lim β u C = lim β u P = 1 lim β u D = T (应用方程B1b方程A3、A4),脱北者是最大的,如果个人的效用非常容易发生危险。中等风险规避(β=−1)或风险倾向(<我>β=1),结果中间(图4 d-f图4 j-l分别)。在风险规避的情况下,人口的频繁的合作者和几个处罚者建立稳定和高合作;第二节、observation-i.e所需的频率。,惩罚执行者的频率(小。

图4
www.雷竞技rebatfrontiersin.org

图4。合作者的replicator-mutator动态(C),叛逃者(D),和第三方惩罚执行者(P)。人口的其中之一的“C”“D”和“P”的角落里,分别。他们的每个单形的每个中心频率相等。箭头表示轨迹从不同的初始状态。红点代表稳定的结果。<年代trong>(J A、D、G M)所有的变种。<年代trong>(B、E、H, K, N)的一个变种。<年代trong>(C、F、我、L O)片面的变体。我们设置<年代trong>(两者)β=−10。<年代trong>(D-F)β=−1。<年代trong>(胃肠道)β=0。<年代trong>(J-L)β=1。<年代trong>(M-O)β=10。参数:<我>T= 2,<我>F= 3,<我>C= 1,<我>w= 0。1,μ= 0。01。

图5
www.雷竞技rebatfrontiersin.org

图5。合作者的replicator-mutator动态(C),叛逃者(D),和第三方惩罚执行者(P)如果我们假设捐赠的游戏。人口的其中之一的“C”“D”和“P”的角落里,分别。他们的每个单形的每个中心频率相等。箭头表示轨迹从不同的初始状态。红点代表稳定的结果。<年代trong>(A、D、G)所有的变种。<年代trong>(B、E、H)的一个变种。<年代trong>(C、F I)片面的变体。我们设置<年代trong>(两者)β=−10。<年代trong>(D-F)β=−1。<年代trong>(胃肠道)β=0。参数:<我>c= 1,<我>b= 2,<我>F= 4,<我>C= 1.5,<我>w= 0。1,μ= 0。01。注意,我们如果忽略结果<我>β>0,脱北者获胜。

比较三种变体的惩罚,都和一个变异比片面变体更容易促进合作的风险规避(清楚地观察到图4 d-f)。这是因为在三个变种,只有错过学期e片面的变体<年代up>−<我>β<我>F叛逃者的实用程序(见方程A4a A4c, A4e)。在其他两个变种与足够强大的避险情绪,最大的术语叛逃者的效用是e<年代up>−<我>β<我>F,这意味着叛逃者的效用是最受到最坏的情况,他/她获得从作弊但没有受到惩罚。片面的变体,最大的术语叛逃者的效用是e<年代up><我>β(<我>T−<我>F),这意味着最主导的情形的效用是叛逃者至少喜欢作弊,但受到惩罚。最难以促进合作的片面的变种,因为这个变体叛逃者的最糟糕的情况是好过的,一个变体。

4所示。捐赠的游戏

整个分析,我们认为,个体弱“囚徒困境”游戏(即。捐赠,方程1)。所谓的游戏,即。,支付矩阵

C D C D ( b c c b 0 ] , ( 11 )

在哪里<我>b><我>c>0,已被许多研究采用(3,16,17,24,25]。对于那些感兴趣的区别这两个游戏,附录C(补充材料),我们注意结果如果我们假设捐赠游戏而不是软弱的囚徒困境博弈。

两场比赛也有类似的结果除了权威第三方惩罚的情况下,观察的权威并不足够频繁的稳定合作:在这种情况下,只有弱者囚徒困境博弈与合作伙伴的全部或一种变体达到二态性和脱北者(2.2节)。这是技术上因为在弱“囚徒困境”游戏中,片面(即合作。,选择C对对手的D)和相互背叛(即。选择D对对手的D)有相同的回报。考虑一个单型的叛逃者人口。我们表示<我>年代和<我>P分别回报如果选择C和回报如果选择D的人口。假设的权威第三方惩罚或一种变体,公用事业的合作伙伴<我>年代和作为一个叛逃者1 /<我>β日志(<我>z/<我>ke<年代up><我>β(<我>P−<我>F)+(1−<我>z/<我>k)<年代up><我>β<我>P),<我>k所有变体和= 1<我>k=2的一个变种。因此, u C > u D z / k > ( 1 - - - - - - e β ( 年代 - - - - - - P ) ) / ( 1 - - - - - - e - - - - - - β F ) ;弱者的“囚徒困境”游戏(即。,如果<我>年代=<我>P),合作者可以入侵叛逃者的人口如果个人权威手表频率(即,<我>z>0);在捐赠的情况下(即游戏。,如果<我>年代−<我>P=−<我>c),合作者可以入侵叛逃者的人口 z > k z DG * (见方程C2)。

5。讨论

在这项工作中,我们调查的风险态度对社会学习动力的影响第三方惩罚。我们研究了两个模型:在第一个模型中,第三方惩罚者是一个外部权威,站在个人的竞争;在第二个模型中,这些人从内部执行第三方惩罚,这样第三方惩罚执行者与non-punishers竞争。在这两种模式,规避风险的个人实现更高的合作与惩罚的频率显著低于中性或较大的个体。在第一个模型中,这意味着一个强大的利维坦,他不断的手表不需要人,严重惩罚违规;在第二个模型中,这意味着不是每个人都需要一个执行者。

我们还研究了三个变量的影响的第三方惩罚,,,和片面的变体,在社会学习动力。在所有变体,脱北者受到惩罚;的一个变种,只有一个叛逃者处罚警告他人;片面的变体,只有那些真正喜欢作弊对合作者受到惩罚。我们发现以来最糟糕的回报的叛逃者片面的变体是温和的比其他两个变量,促进合作是最困难的片面的变体:即使作弊是骗子,维持合作的人应该受到严惩。我们还发现,在权威的惩罚的情况下,所有变体可以更有效的比相当小的频率的一种变体观察:惩罚作为其他人的警告是有效的只有权力可以看的人真的很少。

避险情绪已经直接或间接实验中观察到的社会困境游戏与惩罚的机会(27,28,40]。山(27)报道说,在他的研究中,惩罚的存在足以促进合作在社会困境的早期试验的实验。参与者可能不充分意识到他们早期的奖励结构试验,这惩罚的不确定性将增加参与者的合作。这是符合当前的研究预测,风险厌恶情绪促进合作的存在下的惩罚。秦和王研究惩罚概率的影响。在他们的研究中,他们观察到一个倒u形的关系的概率水平的惩罚和合作,这表明参与者的效用函数是风险厌恶40]。此外,孩子们似乎风险厌恶在惩罚的威胁下(28]。

大量的实验研究报道,惩罚一个游戏,最严重的因素就足以维持合作(27,40- - - - - -44]。这些观测结果符合本研究的一个变体以及所有变体是风险厌恶者有效的促进合作。比较这两个变种,惩罚,惩罚,Andreoni和哇41)和Kamijo et al。42)认为,惩罚是一个更高效的解决方案,促进合作。在目前的研究中,然而,一个变体是更有效的比所有变异的频率只有当看权威是罕见的。因为在他们研究的数量如果被惩罚变量取决于数量的贡献,他们的研究和我们的不具有直接可比性。需要更多的调查澄清这一点。

最后,我们提到一些担忧的假设在我们的模型中。一个是假设个人是同质的风险态度,他们有一个相同的效用函数的随机回报。然而,在现实中,人们有各种各样的个性和异构对风险的态度45,46]。冒险者可能倾向于违规或惩罚执行者,而谨慎的人会倾向于non-punishing合作者避免高风险的事情。应该是有趣的这种相关性风险态度和策略合并到一个扩展模型。另一个问题是假设的风险态度个人是常数随时间而进化策略。它可能是合理的考虑风险规避进化历史上的重要性。事实上,风险厌恶情绪是普遍观察到的动物47),这意味着这是一个至关重要的跨物种的关注。风险规避可能远比惩罚更强大的选择压力下强调规范。

作者的贡献

作者证实了这项工作的唯一贡献者和已批准出版。

资金

资助这项工作的部分支持由Monbukagakusho格兰特16 h06412乔Yuichiro Wakano。

利益冲突声明

作者说,这项研究是在没有进行任何商业或金融关系可能被视为一个潜在的利益冲突。

确认

我们要感谢那些评论家的建设性的评论改进手稿。

补充材料

本文的补充材料在网上可以找到:https://www.雷竞技rebatfrontiersin.org/articles/10.3389/fphy.2018.00156/full补充材料

引用

1。西SA,格里芬,加德纳合作进化的解释。<我>咕咕叫杂志。(2007)<年代trong>17:r661 - 72。doi: 10.1016 / j.cub.2007.06.004

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

2。克拉顿布劳克t非亲人的合作在动物社会。<我>自然(2009)<年代trong>462年:51-7。doi: 10.1038 / nature08366

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

3所示。兰德DG,诺瓦克。人类的合作。<我>Cogn Sci趋势。(2013)<年代trong>17:413 - 25所示。doi: 10.1016 / j.tics.2013.06.003

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

4所示。阿克塞尔罗德r .进化方法规范。<我>Polit Sci牧师。(1986)<年代trong>80年:1095 - 111。doi: 10.2307 / 1960858

CrossRef全文|谷歌学术搜索

5。奥斯特罗姆E。<我>《公地治理:机构集体行动的进化。纽约:剑桥大学出版社(1990)。

谷歌学术搜索

6。p . Boyd R,理查森惩罚允许合作的进化(或其他)相当大的群体。<我>Ethol Sociobiol。(1992)<年代trong>13:171 - 95。0162 - 3095 . doi: 10.1016 / (92) 90032 - y

CrossRef全文|谷歌学术搜索

7所示。菲尔E, fischbach美国社会规范和人类合作。<我>Cogn Sci趋势。(2004)<年代trong>8:185 - 90。doi: 10.1016 / j.tics.2004.02.007

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

8。菲尔E, fischbach美国第三方惩罚和社会规范。<我>另一个星球哼Behav。(2004)<年代trong>25:63 - 87。doi: 10.1016 / s1090 - 5138 (04) 00005 - 4

CrossRef全文|谷歌学术搜索

9。Gurerk O, Irlenbusch B, Rockenbach制裁机构的竞争优势。<我>科学(2006)<年代trong>312年:108 - 11所示。doi: 10.1126 / science.1123633

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

10。西格蒙德·k .惩罚还是灭亡?报复和人类之间的协作。<我>趋势生态另一个星球。(2007)<年代trong>22:593 - 600。doi: 10.1016 / j.tree.2007.06.012

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

11。科尔曼。合作的难题。<我>自然(2006)<年代trong>440年:744 - 5。doi: 10.1038 / 440744 b

CrossRef全文|谷歌学术搜索

12。Hauert C,特劳尔森,布兰德H,诺瓦克,西格蒙德·k·通过强制的自由:昂贵的惩罚的出现。<我>科学(2007)<年代trong>316年:1905 - 7。doi: 10.1126 / science.1141588

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

13。亨利克J,理查德M,巴尔,Ensminger J,巴雷特C, Bolyanatz,等。在人类社会昂贵的惩罚。<我>科学(2006)<年代trong>312年:1767 - 70。doi: 10.1126 / science.1127333

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

14。博伊德R, Gintis H,鲍尔斯美国利他惩罚的进化。<我>《美国国家科学院刊。(2003)<年代trong>One hundred.:3531 - 5。doi: 10.1073 / pnas.0630443100

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

15。布兰德H, Hauert C,西格蒙德·k .处罚和名誉在空间公共物品游戏。<我>Proc R Soc B。(2003)<年代trong>270年:1099 - 104。doi: 10.1098 / rspb.2003.2336

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

16。Nakamaru M,埃瓦萨y利他主义的进化昂贵的惩罚lattice-structured人群:score-dependent可行性与score-dependent生育能力。<我>另一个星球生态Res。(2005)<年代trong>7:853 - 70。网上:http://www.evolutionary-ecology.com/abstracts/v07/1864.html

谷歌学术搜索

17所示。鲁斯P, Gelfand M, nautica D,卡尔·r·高strength-of-ties和低流动性使第三方惩罚的进化。<我>Proc R Soc B。(2014)<年代trong>281年:20132661。doi: 10.1098 / rspb.2013.2661

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

18岁。亨利克J,博伊德r .为什么人们惩罚叛逃者。弱墨守成规传输可以稳定合作困境的昂贵的实施规范。<我>J理论的。(2001)<年代trong>208年:79 - 89。doi: 10.1006 / jtbi.2000.2202

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

19所示。佐佐木T, Brannstrom Dieckmann U,西格蒙德·k .据此选项允许小惩罚来克服社会困境。<我>《美国国家科学院刊。(2012)<年代trong>109年:1165 - 9。doi: 10.1073 / pnas.1115219109

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

20.西格蒙德·K,席尔瓦H,特劳尔森Hauert c .社会学习促进机构管理下议院。<我>大自然。(2010)<年代trong>466年:861 - 3。doi: 10.1038 / nature09203

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

21。Hilbe C,特劳尔森Rohl T,两位m .民主决策建立稳定的政府,克服的悖论二阶的惩罚。<我>《美国国家科学院刊。(2014)<年代trong>111年:752 - 6。doi: 10.1073 / pnas.1315273111

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

22。佐佐木T,冈田克也我,田年代,陈x承诺合作和同行的惩罚:它的进化。<我>游戏(2015)<年代trong>6:574 - 87。doi: 10.3390 / g6040574

CrossRef全文|谷歌学术搜索

23。陈X,佐佐木T, Perc和m .公共合作监视社会的进化与惩罚和类内执行。<我>年代c我代表。(2015)<年代trong>5:17050。doi: 10.1038 / srep17050

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

24。Dreber,兰德DG Fudenberg D,诺瓦克。成功者不惩罚。<我>自然(2008)<年代trong>452年:348 - 52。doi: 10.1038 / nature06723

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

25。吴JJ,张、周ZX他QQ,郑XD,克雷斯曼R, et al。昂贵的惩罚并不总是增加合作。<我>《美国国家科学院刊。(2009)<年代trong>106年:17448 - 51。doi: 10.1073 / pnas.0905918106

CrossRef全文|谷歌学术搜索

26岁。Berthoz年代,多兰Armony J,布莱尔R, R的功能磁共振成像研究的故意和非故意的违反社会规范(尴尬)。<我>大脑(2002)<年代trong>125年:1696 - 708。大脑/ awf190 doi: 10.1093 /

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

27。山t制裁系统作为公共利益的条款。<我>J珀耳斯Soc Psychol。(1986)<年代trong>51:110 - 16。0022 - 3514.51.1.110 doi: 10.1037 /

CrossRef全文|谷歌学术搜索

28。Lergetporer P,安格勒年代,Glatzle-Rutzler D,萨特m .第三方惩罚孩子(偏差)预期,增加合作条件合作。<我>《美国国家科学院刊。(2014)<年代trong>111年:6916 - 21所示。doi: 10.1073 / pnas.1320451111

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

29。拉波波特实验与n人社会陷阱我:囚徒困境,疲软的囚徒困境,志愿者的困境,最大的数。<我>J Conf可溶性酚醛树脂。(1988)<年代trong>32:457 - 72。doi: 10.1177 / 0022002788032003003

CrossRef全文|谷歌学术搜索

30.Hofbauer J,西格蒙德·K。<我>进化游戏和种群动态。剑桥:剑桥大学出版社(1998)。

谷歌学术搜索

31日。磅。泰勒PD, Jonker进化稳定策略和游戏动态。<我>数学Biosci。(1978)<年代trong>40:145 - 56。0025 - 5564 . doi: 10.1016 / (78) 90077 - 9

CrossRef全文|谷歌学术搜索

32。普拉特JW。小型和大型风险规避。<我>费雪。(1964)<年代trong>32:122 - 36。doi: 10.2307 / 1913738

CrossRef全文|谷歌学术搜索

33。霍华德RA, Matheson我。风险敏感的马尔可夫决策过程。<我>等科学。(1972)<年代trong>18:356 - 69。doi: 10.1287 / mnsc.18.7.356

CrossRef全文|谷歌学术搜索

34。Coraluppi SP,马库斯SI。风险敏感性、极大极小和混合中性/极小极大马尔可夫决策过程的控制。张:McEneaney WM阴GG, Q,编辑。<我>随机分析、控制、优化和应用程序。波士顿,MA: Birkhauser (1999)。p .意向。

谷歌学术搜索

35。Mihatsch O, Neuneier r .风险敏感性强化学习。<我>马赫学习。(2002)<年代trong>49:267 - 90。doi: 10.1023 /: 1017940631555

CrossRef全文|谷歌学术搜索

36。页面K,诺瓦克。统一的演化动力学。<我>J理论的。(2002)<年代trong>219年:93 - 8。doi: 10.1016 / s0022 - 5193 (02) 93112 - 7

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

37岁。Hadeler KP。稳定的多态性与突变选择模型。<我>暹罗J:数学。(1981)<年代trong>41:1 - 7。doi: 10.1137 / 0141001

CrossRef全文|谷歌学术搜索

38。Bomze IM,汉堡r .稳定的突变进化游戏。<我>游戏经济Behav。(1995)<年代trong>11:146 - 72。doi: 10.1006 / game.1995.1047

CrossRef全文|谷歌学术搜索

39岁。特劳尔森,Semmann D,索姆费尔德RD Krambeck HJ,两位人类进化游戏更新策略。<我>《美国国家科学院刊。(2010)<年代trong>107年:2962 - 6。doi: 10.1073 / pnas.0912515107

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

40。秦X,王美国使用一个外生机制检查有效的概率的惩罚。<我>J经济学Psychol。(2013)<年代trong>39:1 - 10。doi: 10.1016 / j.joep.2013.07.002

CrossRef全文|谷歌学术搜索

41岁。雇佣Andreoni J,哎呀路枪:委托执法和公共物品提供对等的惩罚。<我>J酒吧经济学。(2012)<年代trong>96年:1036 - 46。doi: 10.1016 / j.jpubeco.2012.08.003

CrossRef全文|谷歌学术搜索

42。Kamijo Y, Nihonsugi T,竹内,Funaki Y维持合作在社会困境:比较集中的惩罚制度。<我>游戏经济Behav。(2014)<年代trong>84年:180 - 95。doi: 10.1016 / j.geb.2014.01.002

CrossRef全文|谷歌学术搜索

43。吴JJ,李,张,克雷斯曼R t y制度激励机制的作用,促进合作的范例。<我>年代c我代表。(2014)<年代trong>4:6421。doi: 10.1038 / srep06421

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

44岁。张董Y, B、t Y的人类行为动力学的公共物品游戏制度激励。<我>年代c我代表。(2016)<年代trong>6:28809。doi: 10.1038 / srep28809

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

45岁。霍瓦特Filbeck G,哈特菲尔德P, P .风险规避和人格类型。<我>J Behav鳍。(2005)<年代trong>6:170 - 80。doi: 10.1207 / s15427579jpfm0604_1

CrossRef全文|谷歌学术搜索

46岁。汤姆SM,福克斯CR Trepel C, Poldrack RA。损失厌恶的神经基础在决策风险。<我>科学(2007)<年代trong>315年:515 - 8。doi: 10.1126 / science.1134239

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

47岁。迈克,奥尔森RS,阿达米C, Hertwig r .风险敏感性的进化适应。<我>年代c我代表。(2015)<年代trong>5:8242。doi: 10.1038 / srep08242

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

关键词:进化博弈动力学、合作、第三方惩罚,社会学习,风险厌恶情绪

<年代pan>引用:中村M(2019)罕见的第三方惩罚促进合作风险社会学习动力。<我>前面。理论物理。6:156。doi: 10.3389 / fphy.2018.00156

收到:2017年9月30日;<年代pan>接受:2018年12月18日;
发表:2019年1月29日。

编辑:

达佐佐木电厂Inc .,日本

审核:

波宇张、北京师范大学、中国
小姐陈中国电子科技大学,中国
维克多·m·Eguiluz、跨学科物理研究所和复杂系统(IFISC),西班牙

版权©2019中村。这是一个开放分布式根据文章知识共享归属许可(CC)。使用、分发或复制在其他论坛是允许的,提供了原始作者(年代)和著作权人(s)认为,最初发表在这个期刊引用,按照公认的学术实践。没有使用、分发或复制是不符合这些条件的允许。

<年代pan>*通信:中村三,nakamuramh@meiji.ac.jp

下载