一般人会凭着感觉认为,警察当然应该看守富户A家财产,因为A有2万元的财产,而B只有1万元的财产。实际上,对于警察的一个最好的做法是,警察抽签决定去A家还是B家。
因为A家的财产是B家的2倍,小偷自然光顾A家的概率要高于B家,不妨用两个签代表A家,比如如果抽到1、2号签去A家,抽到3号签去B家。这样警察有2/3的机会去A家做看守,1/3的机会去B家做看守。
而小偷的最优选择是:以同样抽签的办法决定去A家还是去B家实施偷盗,只是抽到1、2号签去A家,抽到3号签去B家,那么,小偷有l/3的机会去A家,2/3的机会去B家。这些数值是可以通过联立方程准确计算出的,笔者这里就不给出具体的数学计算过程了。
细心的读者会发现,警察捉小偷博弈与前面所举的两个博弈案例有一个很大的差别,就是用到了概率的知识,警察与小偷没有一个一定要选择某个策略的纳什均衡,而只有选择某个策略是多少几率的纳什均衡。
在博弈论中,可以选择出某个策略的纳什均衡,这个策略叫做纯策略。
用专业的话来说,所谓纯策略是指参与者在他的策略空间中选取惟一确定的策略。但至少存在一个混合策略均衡点。
所谓混合策略是指参与者采取的不是惟一的策略,而是其策略空间上的概率分布。这就是纳什于1950年证明了的纳什定理。而这个博弈没有纯策略纳什均衡点,而有混合策略均衡点。这个混合策略均衡点下的策略选择是每个参与者的混合策略选择。
最常见混和策略就是猜硬币游戏。比如在足球比赛开场,裁判将手中的硬币抛掷到空中,让双方队长猜硬币落下的正反面。由于硬币落下是正是反是随机的,概率应该都是1/2。那么,猜硬币游戏的参与者都是1/2的概率选择正与反,这时博弈达到混和策略纳什均衡。
再比如我们儿时玩的“剪、布、锤”就不存在纯策略均衡,对每个小孩来说,自己采取出“剪”、“布”、还是“锤”的策略应当是随机的。一旦一方知道另一方出其中某个策略的可能性增大,那么这个对弈者在游戏中输的可能性就增大。因此,每个小孩的最优混合策略是采取每个策略的可能性是l/3。在这样的博弈中,每个小孩各取三个策略的1/3是纳什均衡。
由此可见,纯策略是参与者一次性选取的,并且坚持他选取的策略。而混合策略是参与者在各种备选策略中采取随机方式选取的。 |