Post #17324

@TinySnowDeprecatedCases

TinyReadiviearning

Views52帖子阅读量

发布1月20日2026/01/20 03:11

Post content

帖子内容

案例分析：剪刀–石头–布爬楼梯游戏[1] 这一幕情景发生在东京闹市的寿司店中。隆志和裕一坐在寿司店中，边喝着米酒，边等着他们的寿司。他们两人都点了该寿司店中的特色寿司，云丹生鱼片（海胆）。不幸的是，厨师说他只剩下一份云丹可以提供。他们中谁会让步呢？在美国，这两个人可能会抛硬币决定。而在日本，这两个人更有可能玩剪刀–石头–布游戏。当然，到现在为止，你已经是剪刀–石头–布的专家，所以，为了使这个问题更具有挑战性，我们引进一种变异版本，称为剪刀–石头–布爬楼梯游戏。该游戏通常在楼梯上进行。跟以前一样，两个选手同时出石头、布或者剪刀。但是现在，胜利者将向上爬楼梯：如果布（五个手指）获胜，则向上爬五级阶梯；剪刀（两个手指）取胜，则向上爬两级楼梯；石头（没有手指）取胜，则向上爬一级楼梯。假如是平局的话要重新再来一局。通常来说，第一个爬到楼梯顶端的是胜者。我们稍微简化这个游戏，假定每个参与者的目标只是尽可能远地超过对方。案例讨论因为每向上爬一级楼梯都会使胜者更靠前，败者更落后，所以我们得到一个零和博弈。考虑所有可能的行动对，我们得到下面的博弈表格。赢利以向前走的楼梯级数来度量。我们怎样找到出剪刀、石头和布的混合策略均衡？前面我们展示了简单的计算和图示方法，这些方法只适用于每个参与者仅两种选择的情况，比如正手击球和反手击球。但是在剪刀–石头–布爬楼梯游戏中，每个参与者有三种选择。第一个问题是：哪些策略会是均衡混合策略中的一部分。这里的答案是三者缺一不可。为了证实这一点，设想裕一从来都不出石头。那么，隆志将永远不出布，而在这种情况下，裕一将永远不使用剪刀。沿着这条思路继续下去，表明隆志将永远不使用石头，这样的话，裕一将永远不使用布。裕一从来不使用石头的假定排除了他所有的策略，所以，这一定是错误的。类似的论证表明，另外两种策略对裕一（隆志）的混合策略均衡也是必不可少的。现在，我们知道了在均衡混合策略中这三种策略都必须用到。问题变成了什么时候这三种策略都要用到。参与者都只对最大化自己的赢利感兴趣，而不是为了混合而混合。当且仅当三个选择具有同等程度的吸引力时，裕一才愿意在石头、布和剪刀之间随机选择。（如果对裕一而言，石头带来的赢利高于布和剪刀的赢利，那么他应该只选择石头；但是那样的话将得不到均衡。）因此，三种策略使裕一得到相同期望赢利的特别情况，就是隆志的均衡混合策略。让我们假定隆志采用如下的混合规则： p=隆志出布的概率； q=隆志出剪刀的概率； 1–（p+q）=隆志出石头的概率。因此，假如裕一出石头，那么，若隆志出布（p）他就会落后五步，若隆志出剪刀（q）他就会前进一步，因此净赢利为–5p+q。利用同样的方法，裕一从每种策略中得到的赢利如下：石头：–5p+1q+0[1–（p+q）]=–5p+q 剪刀：2p+0q–1[1–（p+q）]=3p+q–1 布：0p–2q+5[1–（p+q）]=–5p–7q+5 只有当–5p+q=3p+q–1=–5p–7q+5 时，这三种选择对裕一而言才具有同等的吸引力。求解上述三个方程得到：p=1/8，q=5/8，以及（1–p–q）=2/8。这就是隆志的均衡混合策略。由于这个游戏是对称的，因此裕一将以同样的概率进行随机选择。注意：当裕一和隆志都使用他们的均衡混合策略时，他们从每种策略中得到的期望赢利为零。虽然这并不是混合策略结果的一般特征，但对于对称的零和博弈而言却总是正确的。我们没有任何理由偏爱裕一多于隆志，反之亦然。注意考虑法则 5：其他参与人可能只采用其混合策略中的一个可行的纯策略子集，因为其他的策略将给他一个特别低的赢利（或给你一个特别高的赢利）。均衡解将告诉你，在对手的混合策略中那些策略是活跃的。