Post #17301

@TinySnowDeprecatedCases

TinyReadiviearning

Views58帖子阅读量

发布1月15日2026/01/15 07:37

Post content

帖子内容

基于以下原因，奖励方法可能会有问题。奖励可以是内部的，一方对另一方的合作进行奖励。有时也可以是外部的，可以由从双方合作中获利的第三方对双方的合作进行奖励。不论哪种情形，都不能在参与者做出选择之前给予奖励；否则，参与者一定会把奖励揣入口袋，然后再选择背叛。如果奖励仅仅是一个许诺，那么这个许诺可能是不可信的：在受诺方选择了合作后，许诺方有可能会食言。尽管困难重重，有时奖励还是可行的、有用的。发挥最大的创造性和想象力，参与者可以同时、相互许诺，然后通过把许诺的奖金存入由第三方控制的托管账户中，使这些许诺显得可信。更切实际的是，参与者可以在多个方面相互作用，一方在一个方面的合作可以换来对方在另一个方面合作的奖励。比如，在雌性黑猩猩群中，分享食物、帮忙照看幼崽，可以换来梳理毛发的帮助。有时候，博弈第三方可能有非常强烈的利益动机促成合作。例如，为了结束世界范围内的各种冲突，美国和欧盟不时地许诺向战争国提供经济援助，作为对它们和平解决争端的奖励。1978 年，美国以这种方式奖励了以色列和埃及，因为它们合作签署了戴维营协议。惩罚是解决囚徒困境的更为常用的方法。它可能即时见效。电影《洛城机密》中有这样一个场景，警官埃德·埃克斯利向他正在审讯的嫌犯之一雷若伊·方丹许诺，如果他为国家作证，就可以比其他两个嫌疑犯少判几年。但雷若伊知道，一旦他出狱，他会发现另两个人的朋友正等着报复他！然而，在这种背景下自然而然想到的惩罚，产生于这样的事实，即大多数此类博弈都只是一段持续关系的一部分。欺骗可能使一个参与者获得短期利益，但却会损害这种持续关系，产生更长期的成本。如果该成本非常大，这就可能从一开始就起到了阻吓欺骗的作用。[8] 一个引人注目的例子来自棒球比赛。美国联盟队的击球员被投球击中的概率是 11%，而国家联盟的击球员被击中的概率是 17%。据道格·德林恩（Doug Drinen）和约翰–查尔斯·布拉伯瑞（John-Charles Bradbury）所说，这种区别的主要原因在于指定的击球手规则。在美国联盟队，投球手不击球。因此，攻击击球手的美国联盟队投球手，不必担心对手队的投球手会直接报复。虽然投球手不太可能被击中，但如果他们刚刚在上半场攻击了某个人，那么，他们被击中的机会就会增加 1/4。担心遭到报复是显然的。就像王牌投球手科特·谢林（Curt Schilling）所解释的：“当你面对兰迪·约翰逊（Randy Johnson）时，你还会郑重其事地向某个人投球吗？” 大多数人在考虑一个参与者如何惩罚对方过去的欺骗行为时，就会想到“以牙还牙”的说法。这的确是关于囚徒困境最有名的实验结果。让我们详细叙述在实验中发生了什么，以及我们能从中学到什么。