《三天读懂博弈学》

下载本书

添加书签

三天读懂博弈学- 第8部分


按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
蔽馐Ω底孕∏ǔ珊蟊闵钤谡饫铮恢痹诖说湃殖担惺北惆殉低T诒ㄌ悦娴穆繁摺K担俺闲疟ㄌ蔽挥谑谐∶趴冢赐娜撕芏啵遗员哂屑讣疑唐蹋澳敲炊嗳硕⒌皆冢母龈夷茫俊�
  其实比起“素质高”,吴师傅的关于“不敢拿”的判断,似乎更为符合博弈学原理。我们可以把这个“诚信报摊”看作摊主与买报人之间的博弈,而从博弈过程来看,“诚信报摊”成立第一天那种“每个博弈者都只关心一次性支付的简单博弈”已经转变成了“重复的、连续进行的博弈”,连续博弈的过程中,偷报者必然会担心卖报人可能采取暗中观察、抓住偷报者示众等报复措施,所以会理性地克制投机行为、选择诚信与合作,于是必然就出现了双方都诚信的博弈结果。
  我们可以进而分析,为什么林达所说的美国的无人售报箱中的报纸会被中国人拿光呢?莫非中国人在自己国家内诚信,到了美国就不诚信?不是这样的,而是因为售报箱的位置多设在流动人口比较多的地方,而一个人之所以敢从售报箱中拿走所有的报纸,原因就在于这周围的人都是过客,没有人认识他,他明天也不会再从这个售报箱拿“免费”报纸。也就是说,这是一个单次博弈,而非重复博弈。
  诚然,我们都是经济社会里的“理性人”,并不是天生就懂得守信的天使,现实生活中不诚信的事还很多很多。但成都的这个无人卖报摊3年没少过钱,让我们得到了一些遏制诚信缺失的启示:千百年来,中华民族都将诚实信用视为美德,但更多地是从道德上讲的,而殊少法律的约束,所以现实生活中总会发生诚信危机。实际上我们的社会并不是达不到一个高度的诚信水平,合理的博弈规则才是保证社会诚信的基本条件。而遏制诚信缺失的博弈规则就是将一次性博弈有效地转化为重复性博弈,同时加大对不诚信行为的惩罚力度,增加对不诚信行为处罚的可信性——通俗地讲,就是让每个参加博弈的人都清楚,彼此可以在长期合作中受益,“一锤子买卖”的结果是两败俱伤;同时,如果谁不遵守有利于长期合作的诚信规则,谁就将确定无疑地受到严惩。 。。

第3章  重复博弈:“一锤子买卖”与长期合作(4)
■为什么“毕业了,就说分手”?
  来自西北的李平与来自东南的魏芳是大学同学,二人自大一开始就进入了热恋状态,山盟海誓,亲密有加。然而大学四年倏忽即逝,面临毕业后各自的前程,二人不得不痛苦地选择分手。为什么昔日如此亲密的李平与魏芳会在毕业时选择分手呢?因为这个博弈存在这样一个确切的时间点,到了这个时间点,博弈即告终结,而这个时间点恰好就是“毕业”。
  为什么一毕业,就宣告着一段美好的恋情结束、而昔日亲密无间的恋人也要劳燕分飞呢?这涉及博弈论中的“有限重复博弈”与“无限重复博弈”的问题。为了使读者朋友更容易地理解这个问题,让我们先从大家都熟悉的《鹿鼎记》中所描写的两个情节谈起。
  《鹿鼎记》中韦小宝被太监海大富抓进皇宫之中,却伺机毒瞎了海大富,并杀死了海大富身边的小太监小桂子,从此在宫中冒充小桂子。在顺治帝出家前,海大富受命留在宫中调查找杀死端敬皇后的凶手,他自始就从口音中辨出此小桂子非彼小桂子,却一直没有说破,不动声色地查探这个“小桂子”的幕后指使是谁,后来却意外地从韦小宝身上得知原来杀死端敬皇后的凶手竟然是现在的皇太后。海大富决定向太后发难,韦小宝已无利用价值,于是他最终向韦小宝摊牌。而此时韦小宝才得知原来海大富早已知道他其实不是小桂子,但此时也只能在肚中暗骂海大富“死老乌龟,臭老乌龟!”了。(事见《鹿鼎记》第六回)
  书中还有一次康熙对韦小宝的“摊牌”:康熙早已知道韦小宝是反清组织天地会的香主,却一直隐忍不发。直到韦小宝把天地会众兄弟聚集在自己的伯爵府,康熙决定将其一网打尽之时,才对韦小宝亮出底牌:“天父地母,反清复明!韦香主,你好大的胆子哪!”(事见《鹿鼎记》第四十三回)康熙的这张底牌一亮,就意味着胜负已分,他与韦小宝的这一回合的“斗心眼儿”也宣告结束。
  但是假如海大富没有查出皇太后会“化骨绵掌”且是杀死端敬皇后的凶手,或者假如康熙没有机会把天地会一网打尽,那么他们势必还会把糊涂装到底。装到什么时候是终点呢?恐怕没有人知道。也就是说,只要海大富一天没有查出杀害端敬皇后的凶手,或者康熙一直没有机会把天地会一网打尽,他们就将装作不知韦小宝真实身份的样子一直与韦小宝“玩儿”下去。
  如果我们把韦小宝与海大富及与康熙的“斗心眼儿”视为一场博弈,那么书中所写的最后“摊牌”的情形则被称为“有最后一次重复的博弈”,而我们假设的“一直玩下去”的情形则被视为“无限重复的博弈”。所谓有限重复博弈,是指重复次数是有限的且有确定终点的博弈;而无限重复博弈,则是指重复次数是无限的或者对双方而言不知道哪一次是尽头的博弈。
  通过前面的分析我们知道,在一次性博弈中,“对抗”对双方而言是最优策略,在重复博弈中,“合作”对双方而言是最优策略。而在有限重复博弈中,由于最后一次博弈是确定会出现的,这个“最后一次博弈”可以被视为一个“一次性博弈”,也就是说,在双方的最后一次博弈中,“对抗”是最优策略,因为人们在重复博弈中之所以选择合作,主要是考虑日后还要进行博弈,而在最后一次博弈中则没有以后,因此显然不必考虑后面的行动。 电子书 分享网站

第3章  重复博弈:“一锤子买卖”与长期合作(5)
那么再回到我们前面所说的“毕业了就说分手”的事例,用博弈论的术语来说,这是一个“有最后一次的重复博弈”。毕业之后,二人一个回西北,一个回东南,在一起生活成了不现实的情况。“毕业”这一不可改变的现实,就是博弈的“最后一次重复”,所以二人最佳的选择只能是分手。
  让我们进一步假设:李平与魏芳毕业后留在了同一所城市,他们还会如此轻易地选择分手吗?如果没有特殊情况,应该不会!至少分手的可能性要大大降低,因为毕业后同处一座城市,就是说二人之间还有美好的未来,从而使得二人间的博弈从“有限重复博弈”转成了“无限重复博弈”,而无限重复博弈中,最理性的选择是合作而非对抗。
  因“有最后一次的重复博弈”而发生的对抗性情形在生活中并不鲜见,比如张三、李四两个同事素有矛盾,但既在一家单位工作,二人面临的是长期共事,且谁也不知道会共事到什么时候,如果他们都是严格意义上的“理性经济人”,则通常他们不会大打出手,即便不能化干戈为玉帛,也只会暗斗而不会明争。但一旦哪一天其中的一位决定离开公司,那么,双方积蓄已久的矛盾就很有可能集中爆发,因为“无限重复博弈”转成了“有限重复博弈”,在“有限重复博弈”中,双方所能选择的最佳策略是对抗。
  这种情形有点类似于我们通常所说的“君子报仇,十年不晚”,因为一个理性的人要“报仇”,必须考虑报仇的条件是否成就,会有什么样的后果与得失,而非莽撞行事。但是这并不说明在任何情况下的重复博弈中,隐忍总是最好的策略,有些情况下,“一报还一报”的策略反而能显出奇效,这一点我们将在下篇中予以讨论。
  ■你打我一拳,我是否应该马上踢你一脚?
  电视剧《亮剑》中,日本的山本特工队夜袭独立团团部,掳走了独立团团长李云龙的新婚妻子秀芹,重伤独立团政委赵刚。李云龙集结队伍,未经请示,公报私仇,攻打山本特工队所在的平安县城,最终全歼山本特工队,但秀芹也玉石俱焚。这一仗打出了八路军的威风,更打灭了日本人骄横不可一世的气焰。战斗过后,李云龙去野战医院看望赵刚时,二人有了一番推心置腹的交谈。一向服从上级领导、守纪律、讲原则的赵刚这次没有埋怨李云龙擅自调动部队作战,反而赞赏地对李云龙说:“你李云龙,是有仇就报的性格,那独立团当然也是如此。君子报仇,十年不晚。这句话不适合独立团。独立团是有仇就报,马上就报。你给我一刀,我反手就是一剑。公平合理,决不欠债。”
  “有仇就报,马上就报”如果用博弈论的观点来解释,则可以简单地描述为“针锋相对策略”。这一策略的提出者是美国密歇根大学的学者罗伯特?爱克斯罗德,他是一个政治科学家,研究的领域主要是人与人之间的合作关系。
  爱克斯罗德在开始研究合作之前,设定了两个前提:一、每个人都是自私的;二、没有任何权威干预每个人的决策。也就是说,个人可以完全按照自己利益最大化的企图进行决策。在此前提下,合作要研究的问题是:第一、人为什么要合作;第二、人什么时候是合作的,什么时候又是不合作的;第三、如何使别人与你合作。书包 网 。 想看书来

第3章  重复博弈:“一锤子买卖”与长期合作(6)
在研究的过程中,爱克斯罗得教授组织了一场计算机模拟竞赛,竞赛的思路非常简单:任何想参加这个计算机竞赛的人都扮演“囚徒困境”案例中一个囚犯的角色,他们开始玩“囚徒困境”的游戏,每个人都要在合作与背叛之间做出选择。关键问题在于,他们不只玩一遍这个游戏,而是一遍一遍地玩上200次,这就是所谓的“重复的囚徒困境”,于是这就更逼真地反映了日常人际关系。这又是一个值得注意的条件,最简单的囚徒困境模型说的是一次性博弈,正是这一点加剧了囚徒做出坦白的决心。
  试验的结果使爱克斯罗德大为吃惊,因为竞赛的冠军获得者——多伦多大学的数学教授阿纳托?拉波波特所采取的策略一点都不高深,而是非常简单:一报还一报。也就是我们通常所说的“以其人之道,还治其人之身”。它的特点是:第一次对局采用合作的策略,以后每一步都紧紧跟随对方上一步的策略,你上一次合作,我这一次就合作,你上一次不合作,我这一次就不合作。
  为了进一步验证第一轮游戏得到的结论,爱克斯罗德邀请了更多的人再做一次游戏。这时游戏进入了第二轮。第二次爱克斯罗德征集到了62个程序,同样也附加上他自己的随机程序,又进行了一次竞赛。结果,第一名的仍是针锋相对策略。
  这个如此简单的策略之所以反复赢得竞赛,是因为它奉行了针锋相对的法则,说白了就是一报还一报,即“人不犯我,我不犯人;人若犯我,我必犯人”,但它坚持“有理、有利、有节”的尺度,并且用以下有规律可供遵循的行为将对手纳入长期合作的轨道上来:
  第一,善良的,即从不首先背叛;
  第二,可激怒的,对于对方的背叛行为一定要报复,不能总是合作;
  第三,宽容的,不能人家一次背叛,你就没完没了地报复,以后人家只要改为合作,你也要合作;
  第四,易于察觉的,即逻辑清晰,使对手能够很轻易地发现你采取策略的规律,并且领会你的意图。
  ⊙爱克斯罗德比赛
  罗伯特?爱克斯罗德1943年出生于芝加哥,曾就读于芝加哥大学和耶鲁大学,现在是密歇根大学政治学教授。
  1980年,爱克斯罗德组织了一次关于囚徒困境的不同战略的比赛。比赛包括一些简单的战略,如“针锋相对”和总是犯错误,同时也包括一些比较复杂的战略。他邀请了杰出的博弈理论学家制作了一些程序,通过计算机模拟的方式进行战略之间的对抗。在其一份影响很大的报告中,他指出针锋相对的战略在一定范围内是最优的,不存在一个完美的战略优于其他的战略。
  而输掉这个竞赛的策略,总是在上述四个方面做得不够好。比如竞赛者的脾气过于好,总是“以德报怨”,结果就被狡猾之徒反复地占便宜;有些竞赛者不够宽容,别人背叛一次他就不与对方再次合作,从而使合作关系永久性断绝;还有一些竞赛者太“精于算计”,总是试图通过取巧来占别人的便宜,这种人在与“好脾气者”的博弈中虽然大占便宜,但与“不宽容者”的博弈中往往搬起石头砸自己的脚,而从最后的总分来看,他的“小聪明”总是得不偿失。
  历史反复证明了这一策略的正确性:1945年抗日战争胜利后,为避免内战、争取和平,中囯共产�
小提示:按 回车 [Enter] 键 返回书目,按 ← 键 返回上一页, 按 → 键 进入下一页。 赞一下 添加书签加入书架