帖子内容
案例分析:剪刀–石头–布爬楼梯游戏[1] 这一幕情景发生在东京闹市的寿司店中。隆志和裕一坐在寿司店中,边喝着米酒,边等着他们的寿司。他们两人都点了该寿司店中的特色寿司,云丹生鱼片(海胆)。不幸的是,厨师说他只剩下一份云丹可以提供。他们中谁会让步呢? 在美国,这两个人可能会抛硬币决定。而在日本,这两个人更有可能玩剪刀–石头–布游戏。当然,到现在为止,你已经是剪刀–石头–布的专家,所以,为了使这个问题更具有挑战性,我们引进一种变异版本,称为剪刀–石头–布爬楼梯游戏。 该游戏通常在楼梯上进行。跟以前一样,两个选手同时出石头、布或者剪刀。但是现在,胜利者将向上爬楼梯:如果布(五个手指)获胜,则向上爬五级阶梯;剪刀(两个手指)取胜,则向上爬两级楼梯;石头(没有手指)取胜,则向上爬一级楼梯。假如是平局的话要重新再来一局。通常来说,第一个爬到楼梯顶端的是胜者。我们稍微简化这个游戏,假定每个参与者的目标只是尽可能远地超过对方。 案例讨论 因为每向上爬一级楼梯都会使胜者更靠前,败者更落后,所以我们得到一个零和博弈。考虑所有可能的行动对,我们得到下面的博弈表格。赢利以向前走的楼梯级数来度量。  我们怎样找到出剪刀、石头和布的混合策略均衡?前面我们展示了简单的计算和图示方法,这些方法只适用于每个参与者仅两种选择的情况,比如正手击球和反手击球。但是在剪刀–石头–布爬楼梯游戏中,每个参与者有三种选择。 第一个问题是:哪些策略会是均衡混合策略中的一部分。这里的答案是三者缺一不可。为了证实这一点,设想裕一从来都不出石头。那么,隆志将永远不出布,而在这种情况下,裕一将永远不使用剪刀。沿着这条思路继续下去,表明隆志将永远不使用石头,这样的话,裕一将永远不使用布。裕一从来不使用石头的假定排除了他所有的策略,所以,这一定是错误的。类似的论证表明,另外两种策略对裕一(隆志)的混合策略均衡也是必不可少的。 现在,我们知道了在均衡混合策略中这三种策略都必须用到。问题变成了什么时候这三种策略都要用到。参与者都只对最大化自己的赢利感兴趣,而不是为了混合而混合。当且仅当三个选择具有同等程度的吸引力时,裕一才愿意在石头、布和剪刀之间随机选择。(如果对裕一而言,石头带来的赢利高于布和剪刀的赢利,那么他应该只选择石头;但是那样的话将得不到均衡。)因此,三种策略使裕一得到相同期望赢利的特别情况,就是隆志的均衡混合策略。 让我们假定隆志采用如下的混合规则: p=隆志出布的概率; q=隆志出剪刀的概率; 1–(p+q)=隆志出石头的概率。 因此,假如裕一出石头,那么,若隆志出布(p)他就会落后五步,若隆志出剪刀(q)他就会前进一步,因此净赢利为–5p+q。利用同样的方法,裕一从每种策略中得到的赢利如下: 石头:–5p+1q+0[1–(p+q)]=–5p+q 剪刀:2p+0q–1[1–(p+q)]=3p+q–1 布:0p–2q+5[1–(p+q)]=–5p–7q+5 只有当–5p+q=3p+q–1=–5p–7q+5 时,这三种选择对裕一而言才具有同等的吸引力。 求解上述三个方程得到:p=1/8,q=5/8,以及(1–p–q)=2/8。 这就是隆志的均衡混合策略。由于这个游戏是对称的,因此裕一将以同样的概率进行随机选择。 注意:当裕一和隆志都使用他们的均衡混合策略时,他们从每种策略中得到的期望赢利为零。虽然这并不是混合策略结果的一般特征,但对于对称的零和博弈而言却总是正确的。我们没有任何理由偏爱裕一多于隆志,反之亦然。 注意考虑法则 5:其他参与人可能只采用其混合策略中的一个可行的纯策略子集,因为其他的策略将给他一个特别低的赢利(或给你一个特别高的赢利)。均衡解将告诉你,在对手的混合策略中那些策略是活跃的。