生活中的博弈论 上一节     回书目   下一节    下一章

第一部分
爱克斯罗德试验中的针锋相对策略(1)
作者 : 余治国 江雨燕


  如果没有外部强制力,囚徒困境中的参与者怎样才可以维持合作呢?

  这是一个非常实际的问题。比如在国际事务上,国家与国家之间经常就某些问题达成一定的协议,这种协议我们在前面解释过,由于不存在一个世界性的政府,约束力往往很小。

  对于这个问题,有这样一种答案。如果一方采取不合作的策略,另一方随即也采取不合作策略并且永远采取不合作策略,在博弈论里面称之为触发策略(Trigger strategy),或称冷酷策略。

  如果对方知道你的策略是触发策略,那么对方将不敢采取不合作策略,因为一旦他采取了不合作策略,双方便永远进入不合作的困境。因此,只要有人采取触发策略,那么双方均愿意采取合作策略。

  但是这个策略面临着这样一个问题:如果双方存在误解,或者由于一方发生选择性的错误,这个错误是无意的,那么结果将是双方均采取不合作的策略。也就是说,这种策略不给对方一个改正错误或解释错误的机会。

  美国密西根大学罗伯特·爱克斯罗德教授那个著名试验,给出了这个问题更好的答案。爱克斯罗德邀的这些人都是政治学家、数学家、经济学家、社会学家。获胜者是加拿大多伦多大学的拉波波特写出的针锋相对(tit-for-tat)策略。说穿了,所谓针锋相对策略,就是胡萝卜加大棒的原则。

  爱克斯罗德在开始研究合作之前,设定了两个前提:一、每个人都是自私的;二、没有任何权威干预每个人的决策。也就是说,个人可以完全按照自己利益最大化的企图进行决策。在此前提下,合作要研究的问题是:第一、人为什么要合作;第二、人什么时候是合作的,什么时候又是不合作的;第三、如何使别人与你合作。

  这个游戏共进行了两轮。在第一轮游戏中,共有14个程序参加竞赛,并附加上爱克斯罗德自己的一个随机程序(即以50%的概率选取合作或不合作),总共运转了200次。结果得分最高的程序是加拿大学者罗伯布编写的针锋相对策略程序。

  这个程序的特点是:第一次对局采用合作的策略,以后每一步都紧紧跟随对方上一步的策略,你上一次合作,我这一次就合作,你上一次不合作,我这一次就不合作。爱克斯罗德还发现,得分排在前面的程序有三个特点:第一,从不首先背叛,即“善良的”;第二,对于对方的背叛行为一定要报复,不能总是合作,即“可激怒的”;第三,不能人家一次背叛,你就没完没了地报复,以后人家只要改为合作,你也要合作,即“宽容性”。
世界图书出版公司    
上一节     回书目   下一节   下一章