按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!
,进攻秦王国东方边界重镇函谷关(河南灵宝东北)。这次虽然是以楚国为首,好像齐国没有参加,但此时却还存在另外一个联盟,就是齐楚联盟,这个联盟在第一次“合纵”失败后仍然存在,所以齐国并没有在五国背后插刀。
这是一次声势浩大的军事行动,人人都预料将爆发一场大战。可是,秦国守关大将樗里疾大开关门,出兵迎战。五国联军震于秦军的声威,竟面面相觑,谁都不敢先行攻击。从博弈规则看来,五国同心协力进攻就成了“囚徒”的抵赖,就整个团体而言,它们可能获得最好的结果,而撤退是它们的“严格优势策略”。从合作性博弈规则来看,五国结成了同盟,就已经是一种合作关系,达到了一个博弈均衡点,而在这个均衡状态中,参与者谁先改变支付,谁就会得到利益。因此,在僵持了几天之后,楚兵团因粮道被秦国切断,在惊恐中第一个撤退,但它的损失应该是最小的,因为它没有遭到追击,而其他五国军队在跟着仓皇拔营回国时,就很可能遭到秦国的追击,事实也是如此,最后一个撤退的损失最大。合纵对抗盟约又一次瓦解。
但“合纵”和“连横”的真正关键是楚国。或者说齐秦斗争的焦点在于争取楚国。因为楚国是南方的一个大国强国,楚国是领土最广大、人力最雄厚的大国,秦国不敢轻视它,尤其恐惧楚国跟齐国联合。在当时的条件下,秦国还没有实力来战胜齐楚两国的联盟。而强大的秦国对其他六国都是一个潜在的威胁,楚国在分析了各方面的情况后,与齐歃血为盟,结成了“合纵”的局面。正如我们前面所分析的,因为生存的利害关系,促使了博弈双方的两个“囚徒”走上了“抵赖”的合作之路,而出现这种结果条件就是两者利益完全捆绑,一荣俱荣,一损俱损。这是齐楚两国在客观理性上的分析而能够通过协商来进行合作的结果。
但这种联盟很明显有一个前提,那就是秦国是齐楚的共同敌人,而在国家关系上是没有永远的敌人和朋友的,所以一旦敌人转化为朋友,“合纵”这个联盟也就霎时崩溃。而在此时,“连横”高手张仪横空出世,他正是深谙此道的博弈高手,正是他上演了一幕“一人打败楚国”的神话。为了瓦解齐楚“合纵”联盟,张仪入楚并口头许愿,以归还楚国商於(在今河南淅川县西南)六百里的地方为代价。楚怀王信以为真,就和齐国断交。这里张仪运用的正是“囚徒困境”中的“坦白”利益条件,使楚国陷于“严格优势策略”的选择当中。
但这种严格优势策略的选择是要付出代价的,如果说囚徒之间的坦白只是从此以后两个人的私人关系的终结(当然不是绝对的),那么,国与国在这种情况下是不可能在短时间内再进行合作了,齐楚“合纵”联盟瓦解。
这时,齐秦斗争趋于白热化。山东五国的“合纵”依然存在。公元前298年,齐、韩、魏、赵、中山五国联军攻入函谷关。秦国被迫退还韩、魏的一些地方,五国才退了兵。齐国成为关东各国的盟主。但这种同盟并不牢固,当利益条件再度改变时,山东五国的“合纵”也就不复存在了。公元前288年,秦昭王自称西帝,尊齐愍王为东帝,用远交近攻的策略拉拢齐国,破坏了关东的“合纵”联盟。
在战国这嘲合纵”和“连横”的历史博弈中,秦国成了最终的“警察”,而其他六国则相继沦为了“囚徒”,这六个“囚徒”在各自的历史舞台上都进行了“严格优势策略”的选择,然而都没有逃脱灭亡的历史悲剧,正如博弈中“囚徒困境”中的囚徒不能逃脱惩罚一样。在历史的博弈中,国家眼前的利益和国家长远的利益永远是一个辩证的矛盾体,二者统一于国家的发展之中。当眼前利益跟长远利益一致时,它就促进国家的发展;当眼前利益和长远利益相悖时,就会阻碍国家的发展,甚至使国家走上灭亡。
“合纵”是六国的长存之道,也就是它们的长远利益。但它在当时是难以直接地显现出来;而“连横”是六国的暂存之道,但这种暂存之道却是不利于六国的长存之道,但这种利益是眼前可以看到的,而这种眼前利益正是博弈中的“严格优势策略”,能使国家暂时地很好生存,但这种生存不是长存。
博弈智慧
生存未必是硬道理。长存才是硬道理。由此看来,在“合纵”和“连横”这场历史的较量中,“连横”是取得了最终的胜利。“囚徒”分担了罪名,“警察”得到了最大的实惠。
第32章 “囚徒困境”的思考()
在博弈论中,有一个流传颇为广泛的故事,叫做“囚徒困境”。
话说有一天,一位富翁在家中被杀,财物被盗。警方在此案的侦破过程中,抓到两个犯罪嫌疑人a和b,并从他们的住处搜出被害人家中丢失的财物。但是,他们都矢口否认曾杀过人,辩称是先发现富翁被杀,然后只是顺手牵羊偷了点儿东西。于是警方将两人隔离审讯。
这个时候,聪明的警官找他们谈话,分别告诉他们说:“你们的偷盗罪确凿,所以可以判你们2年刑期。但是,我可以和你做个交易。如果你招了,他不招,那么你会作为证人无罪释放,他将被判10年徒刑;如果你招了,他也招了,你们都将被判5年有期徒刑;如果他招了,你不招,他无罪释放,你被判无期徒刑,终身囚禁;如果你们都不招,各判2年。”
一般读者可能会误认为,既然两个囚犯最好的结果是都不招供,两人都只被判2年,那么,两个囚犯都选择不招供就是这个博弈的最终结果。
然而,人算不如天算,“囚徒困境”之所以称为“困境”正是因为这个博弈的最终结局恰恰是最坏的结果,即两个囚犯统统招供,结果都被判有期徒刑5年。
反过来说,这也是警官的聪明之处。警官采取的游戏规则必然会让两名囚犯坦白罪行,认罪服法。对一个博弈来说,游戏规则非常的重要,适宜的规则才能够达到目的。在我们的日常生活中莫不如此,规则制定者往往利用条件制定出有利于自身的规章制度。
读到这里,很多读者不禁会问,为什么两个人都选择了“招”,傻到接受这种最坏的结果呢?
在解释这个问题之前,需要首先说明一下,囚徒困境和其他的博弈一样,都需要有两个前提假设:囚徒a和b两人都是自利理性的个人,即只要给出两种可选的策略,每一方将总是选择其中对他更有利的那种策略;两人无法沟通,要在不知道对方所选结果的情况下,独自进行策略选择。
囚犯“思想搏斗过程”大致如下,囚犯a的内心活动是这样:假如他招了,我不招,我就要将牢底坐穿,招了最坏坐10年,还是招了合算;假如他不招,我也不招,只坐2年的牢(因无法串供,风险太大);如果我招,他不招,马上被释放,也是招了合算。
因此,无论囚犯b是坦白还是沉默,囚犯a采取坦白的策略对自己更为有利。
同样,以上推理也适用于囚犯b。结果两个囚徒都坦白了,都被判刑5年。
囚徒困境之所以被称为“困境”,正是在于:如果a、b二人都保持沉默,则都只被判刑2年,显然比两人都坦白的结果要好。
两名囚犯都作出招供的选择,这对他们个人来说都是最佳的,即最符合他们个体理性的选择。按照博弈论的说法,这是唯一的纳什均衡点。
除了这个均衡点,a与b的任何一人单方面改变选择,他只会得到更加不经济的结果。而在其他的结果中,比如两人都不坦白的情况下,都有一人可以通过单方面改变选择,来减少自己的刑期。可是两人经过一番理性计算后,却选择了一个使自己陷入不利的结局。
其实“囚徒困境”不允许囚犯a和b进行沟通的假设,与实际生活中大部分情况的现实是有差异的。比如,在爱情博弈中,很多恋人会经常花前月下、彻夜厮守;在企业的价格战中,企业之间也会多有沟通,甚至结成价格联盟;即使是20世纪下半世纪的美苏军备竞赛中,两个超级大国也会经常进行外交交谈,及时交换信息。
因此不妨将条件放宽,允许囚犯a和b在审讯室里在一起呆上10分钟,给予他们充分的串供的机会。
很明显,双方交流的主旨就是建立攻守同盟,克服自利心理,甚至可能订立一个口头协议,要求双方都不去坦白。然后,双方再单独被提审。
我们不妨设想囚犯a的心理活动。他一定会认为,如果囚犯b遵守约定的话,则自己坦白就可获得自由;如果囚犯b告密的话,若自己不坦白就会被终生囚禁。事实上,囚犯a的策略并没有因为简单的沟通或协议而摆脱两难境地。对于囚犯b也是一样。
虽然“坦白从宽,抗拒从严”的道理人人都懂,而从博弈论的角度来看,实际上就是一个囚徒困境的应用。“囚徒困境”被看成是博弈论的代表性案例,不仅因为其简单易懂,还在于它的现象在日常生活中广泛存在。
比如,恋人们在恋爱中的海誓山盟,最终还是分手;企业之间相互沟通合作结成战略关系时是信誓旦旦,但价格战仍然会爆发;美苏两国经常会晤,甚至签订核不扩散条约,但军费一年高过一年。
囚徒困境的游戏规则,能够让狡猾的罪犯招供,得到应有的惩罚,固然不是坏事。然而,我们不妨假设囚徒a和b完全都是清白的具有理性的大大的良民,这个博弈的纳什均衡并不会因为他们的清白而改变。如果在现实生活中,审案存在对身体的残害,完全可能造成屈打成招的冤假错案。在中国历史上,这种冤案并不是什么稀少的事情。
从更深刻的意义上讲,囚徒困境模型动摇了传统社会学、经济学理论的基础,这是经济学的重大革命。