应者再拒绝微小的份额就非常不可能了。为了检验这一说法,人们改在几个比较贫穷的国家做这个最后通牒博弈实验,在这些国家,实验金额相当于参与者几个月的收入。拒绝的可能性确实变得微乎其微了,但是提议者却没有明显变得更加吝啬。对于提议者而言,遭到拒绝的后果变得更加严重了,比他们的行为给回应者带来的后果还要严重,因此,担心遭到拒绝的提议者可能会更加谨慎地行事。
虽然一些行为可以通过本能、荷尔蒙或者大脑中的情感得到部分解释,但有些行为随着文化的不同也有所不同。在不同国家所做的实验中,实验者发现,关于怎样的提议才算合理的观念,不同的文化中的差别度高达10%,但是像侵略性或强硬性这样的性质,不同的文化中的差异较小。只有一个群体与其他群体有明显的不同:在秘鲁亚马孙河畔的马奇根加部落(Machiguenga),提议者提供的份额很小(平均为26%),却只有一个提议遭到了拒绝。人类学家解释说,那是因为马奇根加人以小家庭为单位生活,他们和社会隔离,而且没有什么分享准则。与此相反,在两个国家中,提议额超过了50%;这两个国家有一种习俗,那就是当一个人好运降临时,他会十分慷慨地赠予其他人,而接受者有义务在将来更慷慨地给予回报。这个准则或习惯似乎也影响了这个实验,虽然参与者们并不知道他们将要把钱给谁或者谁将要把钱给他们。9
公平和利他主义的演化(1)
从这些最后通牒博弈实验以及类似最后通牒博弈的其他实验的结果中,我们应该学到什么?基于每个参与者都只关心自身利益的假设,运用倒后推理理论所得到的结果与实验结果大相径庭。正确的倒后推理和自私自利,哪一个是错误的假设?或者是否有一个组合?它们暗示了什么?
我们首先考虑倒后推理假设。在《幸存者》节目中的21支旗博弈中,我们看到,参与者没能正确地或彻底地进行倒后推理。但那是他们第一次玩这个游戏,甚至在当时,他们的讨论也显示出了短暂的正确推理。我们的课堂实验表明,学生们在玩或看别人玩这个博弈三四次之后,便学会了彻底的倒后推理。许多实验不可避免地或者基本上是有意地选择那些初次接触博弈的人作为受试者,这些人在博弈中的行动通常也是学习这个博弈的过程。现实的商界、政界和专业体育比赛中,人们对他们参与的博弈十分有经验。我们希望参与者们能积累更多的经验,不论是利用推理,还是依靠训练出来的本能,他们都能采取大体正确的策略。对于一些稍微复杂的博弈,有策略意识的参与者可以使用电脑或聘用顾问来进行推理;这种做法虽然比较少见,但一定很快就会推广开来。因此,我们相信,倒后推理仍然是我们分析这类博弈以及预测其结果的出发点。接下来,我们将在特定背景下对第一步分析做出必要的修改,我们必须认识到初学者可能会犯错误,而且某些博弈可能会变得太过复杂,以至于无法独立解决。
我们认为,从这些实验性研究中得到的更重要的教训是,人们在选择时,除了考虑自身利益之外,还会考虑到许多其他因素和偏好。这使我们超越了传统经济学的范畴。在进行博弈论分析时,我们还应当考虑参与者对公平或利他主义的关注。“行为博弈论延续了理性假设,而不是抛弃了理性假设。”10
这一切都在向好的方向发展;更好地理解人们的动机,可以加深我们对经济决策制定和策略互动的理解。而且这的确实实在在地发生着;在博弈论的前沿研究中,正日益将平等、利他主义及类似的动机纳入参与者的目标(甚至还包括参与人对奖励或惩罚那些遵守或违背这些规范的参与者的“第二轮”关注)。11
但我们的推理却不应就此停步;我们应再前进一步,考虑一下为什么利他主义和公平动机,以及对违反规范者的生气或厌恶感,对人们会有如此强烈的影响?这把我们带入了思辨的王国,不过我们在演化心理学中可以找到一个看来比较合理的解释。那些向其成员灌输公平主义和利他主义准则的集团,比那些由纯粹自私的个人组成的集团更少发生内部冲突。因此,他们的集体行动更容易取得成功,例如提供有利于全体成员的商品,或者保护公共资源。而且,在解决内部冲突时,他们花费的努力和资源也要少得多。结果是,无论是在绝对意义上,还是在与其他没有类似准则的集团竞争时,它们都会做得更好。换句话说,某种公平和利他的措施,可能具有演化的生存价值。
拒绝不公平提议的某个生物学证据来自特里·伯纳姆(Terry Burnham)做的实验。12在他的最后通牒博弈版本中,利益总额是40美元,受试者都是哈佛大学的男研究生。分割者只有两个选择:给对方25美元,自己保留15美元;或者给对方5美元,自己保留35美元。对于那些只提供5美元的提议,有20个学生接受了提议,6个学生拒绝了提议,结果自己和分割者都一无所获。现在,来看一句点睛之笔。结果证明,拒绝提议的那6个人的睾丸激素比那些接受提议的人高50%。就睾丸激素与身体状况和攻击性相联系这一点来说,这可能提供了一个基因联系,可以解释演化生物学家罗伯特·特里费斯(Robert Trivers)所谓的“道德攻击性”的演化优势。
公平和利他主义的演化(2)
除了潜在的基因联系,社会团体在传递社会准则时还会采用非基因方式,即对家中婴儿和学校中的孩子的教育过程及社会化过程。我们通常能看到家长和老师教育易受影响的孩子们关心他人、与人分享和友善的重要性;其中一些教诲无疑会一直牢牢印在他们的脑海里,并影响他们一生的行为。
最后,我们想指出,公平动机和利他主义都有其局限性。一个社会的长期进步和成功需要不断地创新和改变。这反过来又要求人们有个人主义观念以及向社会准则和传统观念挑战的意愿;因为自私自利通常伴随着这些性格特征。我们需要正确地权衡利己行为和利他行为。
非常复杂的树
当有了一点倒后推理的经验后,大家会发现,日常生活或工作中很多策略局势都可以遵循“树逻辑”加以处理,而不必专门画出博弈树来进行分析。其他许多中等复杂的博弈可以通过越来越完善的专门电脑软件包来处理。但对于像象棋这样的复杂博弈,想通过倒后推理完全求解几乎是不可能的。
理论上而言,象棋是一个理想的可以通过倒后推理加以解决的序贯行动博弈。13在这个博弈中:参与者交替行动;参与者之前的所有行动都是可观察且无法撤销的;局势和参与者动机没有不确定性。如果相同的局势重复出现,比赛就算平局,这一规则确保比赛能在有限次行动后结束。我们可以从最末端那个决策点(或者终点)开始倒后推理。然而,理论和实践完全是两码事。据估计,象棋中的决策点总共大约有10120个,也就是1后面加120个零。一台比普通计算机速度快1 000倍的超级计算机,也需要10103年才能把这些决策点全部考察完。等待是徒劳的;即便是可以预见的计算机改进,也不可能对这有太大的帮助。而与此同时,象棋选手和电脑象棋程序员都做了什么?
临近比赛结束之际,象棋大师在刻画最优策略方面一直做得非常成功。一旦棋盘上只剩下很少几个棋子,大师级选手就能展望博弈的结局,然后通过倒后推理来判断一方是否一定取胜,或者另一方能否确保打成平局。但在博弈中盘阶段,当棋盘上还有好些棋子的时候,预测局势就困难得多了。向前展望十步,这与象棋大师们在适当的时间内所能展望的步数差不多,也不可能使局势简化到可以使当时的局势直到终局都得到完全解决。
实用性的方法是将展望分析和价值判断相结合。前者属于博弈论科学——向前展望,倒后推理。后者属于象棋艺术,能够根据棋子的数目和棋子之间的相互联系判断出所处局面的价值,而无须从某个决策点开始向前展望,明确找出这个博弈的解决方法。象棋选手们通常把这称为“知识”,但你也可以把它称为经验、本能或者艺术。我们通常可以根据象棋选手掌握“知识”的深度和精度,来识别出谁是最佳的象棋选手。
我们可以通过对大量的象棋博弈和象棋选手进行观察,提炼“知识”,然后总结出规律。对此的大部分研究都集中在开局,即棋局刚走了10步或者15步时。有很多书籍对不同的开局进行了分析和比较,讨论了它们的优缺点。
计算机是怎样做到这一点的?编制电脑象棋程序曾经被认为是新兴人工智能科学的组成部分;它的目的是为了设计出能像人类一样思考的计算机。可惜研究了很多年都没能成功。后来,人们的注意力开始转向利用计算机做它们最擅长的事情——数字运算。计算机可以向前多展望几步,而且展望得比人类更快。到20世纪90年代末,像菲兹(Fritz)和深蓝(Deep Blue)这样的象棋电脑,已经可以利用纯粹的数字运算,与人类最优秀的象棋选手进行较量了。再后来,一些中盘局面的知识也被编入电脑程序,这些知识是由一些最优秀的人类棋手所传授的。txt电子书分享平台
公平和利他主义的演化(3)
但是,优秀的象棋选手可以利用他们掌握的知识,立即区分出哪步棋不该走,而不需要向前展望四五步棋来预测其结果,这样他们就省下了推理哪步棋比较好的时间和精力。人类棋手的等级是根据他们的业绩评定的;最高等级的电脑已经达到了相当于2800等级分的级别,这相当于世界最强的象棋大师加里·卡斯帕罗夫(Garry Kasparov)的水平。2003年11月,卡斯帕罗夫与最新版的菲兹电脑X3D进行了一场四轮赛。结果是双方各胜一局,打平两局。2005年7月,Hydra象棋电脑在一场六轮赛中,以五胜一平的成绩打败了世界排名第13位的迈克尔·亚当斯(Michael Adams)。估计在不久的将来,电脑可能会成为顶级高手,然后它们之间开始相互较量,争夺世界象棋冠军。
大家将从中学到什么呢?它说明了考虑复杂博弈的方法,这些复杂博弈是大家可能会面临的。你应该在你的最大推理范围内,把向前展望、倒后推理的规则和引导你判断中盘局面价值的经验结合起来。成功源于对博弈论科学和具体的博弈艺术的综合,而不是来自它们其中之一。
一心二用
象棋策略说明了向前展望、倒后推理方法的另一个实用性特征:你必须从参与者双方的角度来进行博弈。虽然根据复杂的博弈树来估计自己的最佳行动比较困难,但预测对方的行动比这还要困难得多。
如果你和对方真的可以分析出所有可能的行动和反行动,那么,你们俩就会事先在整个博弈的结果将会如何的问题上达成一致。但是,一旦这个分析只限于考察整个博弈树的某些分支,对方就可能获得一些你没有的或者你错过的信息。这样,接下来对方就可能采取一个你未曾预料到的行动。
要真正做到向前展望、倒后推理,你必须预测对方实际会采取什么行动,而不是你站在他们的立场将会采取什么行动。问题在于,当你尝试站在对方的立场时,要忘掉自己的立场,这虽然不是不可能,但也是非常困难的。你太清楚自己下一步的行动计划了,而且当你从对方参与者的视角观察这个博弈时,你很难将自己的意图抹掉。的确,这解释了为什么人们不自己和自己下棋(或玩扑克)。你肯定不能向自己虚张声势,然后再出其不意地攻击自己。
这个问题不存在完全的解决方法。当你尝试站在对方的立场上看问题时,你必须知道他们知道的信息,不知道他们不知道的信息。你的目标必须是他们的目标,而不是你所希望的他们的目标。在实践中,试图对潜在商业场景中的行动和反行动进行模拟的公司,通常都会聘请局外人来扮演其他参与者的角色。这样一来,他们可以确保他们的博弈搭档不会知道得太多。通常,最大的收获来自于看到了未预料到的行动后,找出导致这个结果的原因,以避免或者促进这一结果。
在本章结束时,我们回到查理·布朗是否该去踢球的问题。这是足球教练汤姆·奥斯本(Tom Osborne)在锦标赛最后时刻面临的真正问题。我们认为他也做错了。通过倒后推理分析,我们可以知道他错在哪里。
汤姆·奥斯本与1984年度橘子杯决赛的故事
在1984年的橘子杯决