TGTGInsighttelegram intelligenceLIVE / telegram public index
← TinyReadiviearning
TinyReadiviearning avatar

TGINSIGHT POST

Post #17301

@TinySnowDeprecatedCases

TinyReadiviearning

Views58帖子阅读量
发布1月15日2026/01/15 07:37
Post content

帖子内容

基于以下原因,奖励方法可能会有问题。奖励可以是内部的,一方对另一方的合作进行奖励。有时也可以是外部的,可以由从双方合作中获利的第三方对双方的合作进行奖励。不论哪种情形,都不能在参与者做出选择之前给予奖励;否则,参与者一定会把奖励揣入口袋,然后再选择背叛。如果奖励仅仅是一个许诺,那么这个许诺可能是不可信的:在受诺方选择了合作后,许诺方有可能会食言。 尽管困难重重,有时奖励还是可行的、有用的。发挥最大的创造性和想象力,参与者可以同时、相互许诺,然后通过把许诺的奖金存入由第三方控制的托管账户中,使这些许诺显得可信。更切实际的是,参与者可以在多个方面相互作用,一方在一个方面的合作可以换来对方在另一个方面合作的奖励。比如,在雌性黑猩猩群中,分享食物、帮忙照看幼崽,可以换来梳理毛发的帮助。有时候,博弈第三方可能有非常强烈的利益动机促成合作。例如,为了结束世界范围内的各种冲突,美国和欧盟不时地许诺向战争国提供经济援助,作为对它们和平解决争端的奖励。1978 年,美国以这种方式奖励了以色列和埃及,因为它们合作签署了戴维营协议。 惩罚是解决囚徒困境的更为常用的方法。它可能即时见效。电影《洛城机密》中有这样一个场景,警官埃德·埃克斯利向他正在审讯的嫌犯之一雷若伊·方丹许诺,如果他为国家作证,就可以比其他两个嫌疑犯少判几年。但雷若伊知道,一旦他出狱,他会发现另两个人的朋友正等着报复他! 然而,在这种背景下自然而然想到的惩罚,产生于这样的事实,即大多数此类博弈都只是一段持续关系的一部分。欺骗可能使一个参与者获得短期利益,但却会损害这种持续关系,产生更长期的成本。如果该成本非常大,这就可能从一开始就起到了阻吓欺骗的作用。[8] 一个引人注目的例子来自棒球比赛。美国联盟队的击球员被投球击中的概率是 11%,而国家联盟的击球员被击中的概率是 17%。据道格·德林恩(Doug Drinen)和约翰–查尔斯·布拉伯瑞(John-Charles Bradbury)所说,这种区别的主要原因在于指定的击球手规则。在美国联盟队,投球手不击球。因此,攻击击球手的美国联盟队投球手,不必担心对手队的投球手会直接报复。虽然投球手不太可能被击中,但如果他们刚刚在上半场攻击了某个人,那么,他们被击中的机会就会增加 1/4。担心遭到报复是显然的。就像王牌投球手科特·谢林(Curt Schilling)所解释的:“当你面对兰迪·约翰逊(Randy Johnson)时,你还会郑重其事地向某个人投球吗?” 大多数人在考虑一个参与者如何惩罚对方过去的欺骗行为时,就会想到“以牙还牙”的说法。这的确是关于囚徒困境最有名的实验结果。让我们详细叙述在实验中发生了什么,以及我们能从中学到什么。