【正见网2010年07月29日】
二、从博弈论的《囚徒困惑》谈起
博弈论(game theory)通俗的讲就是两个人下棋的方法,就是关于对弈的决策,又称对策论,是一门专业学问,是可以问鼎诺贝尔经济学奖的大学问。人们耳熟能详的博弈论事例恐怕就是当年的田忌赛马了。实际上博弈论是研究两人或多人之间竞争关系的一门学问,它是使用数学模型这个手段研究各种冲突模式的。我们在时事新闻中经常听到的所谓“零和游戏”(zero-sum game)或“非零和游戏”(non-zero-sum game或positive-sum game)或所谓的“双赢”,其实都是博弈论的术语,这可不是什么电子游戏,这是专业术语。由于本人在二十多年前的一个学长室友是主攻博弈论研究的,所以我对博弈论多少也知晓一些,有所涉足,虽然达不到专业水平,但比起一般人可能知道的还是多一些。由于本文并不是通篇讲述博弈论的,本文的核心还是要讲述沟通的意义,因为经典博弈论《囚徒困惑》很能说明沟通的意义,所以我们拿出来讲,并作为本系列的开篇。由于是借来一用,所以也借用了《30天让你精通博弈学》一书的许多文字,特此说明。
博弈论是由美国数学家约翰・冯・诺伊曼创立的。1944年他与经济学家奥斯卡・摩根斯坦合作发表了巨著《博弈论与经济行为》,将博弈论引入了经济领域,所以博弈论现在是经济学的一个分支。
《囚徒困惑》往往是博弈论的开篇,它是数学家塔克1950年在斯坦福大学任客座教授时给一些心理学家们讲授的,非常形象易懂,所以博弈论以后将类似问题都称作《囚徒困惑》,广为人知,并在哲学、伦理学、社会学、政治学、经济学乃至生物学等学科中获得了极其广泛的应用,本文也可以算作多一个应用吧。
所谓《囚徒困惑》,我这里只是原样表述,先不做价值判断,大意是这样的:甲、乙两个人一起带枪作案,结果被警察发现抓了起来。警方怀疑,这两个人可能还犯有其它重罪,但没有证据。于是進行分别审讯,为了分化瓦解对方,警方告诉他们,如果主动坦白,可以减轻处罚;如果顽抗到底,一旦同伙招供,你要不招供就要受到严惩。当然,如果两人都坦白,那么所谓的“主动交代”就不那么值钱了,在这种情况下,两人还要受到惩罚,只不过比一人顽抗到底要轻一些。在这种情形下,两个囚徒都会作出自己的选择:或者供出他的同伙,即与警方合作,从而背叛他的同伙;或者保持沉默,也就是与他的同伙合作,而不与警方合作。这样会出现以下几种情况(为了更清楚的说明问题,往往给每种情况设定了具体刑期):
如果两人都不坦白,警察会以非法携带枪支罪将二人各判刑一年;
如果其中一人招供而另一人不招供,坦白者作为证人将不会被起诉,另一人将会被判20年;
如果两人都招供,则两人都会因罪名各判10年。
那么这两个囚徒面对这样的情况会怎么办呢?也就是他们应该选择互相合作还是选择互相背叛?
从表面上看,他们应该选择互相合作,保持沉默,因为这样他们俩都可以得到好的结果――只判刑一年,这是集体最优解。但是他们不得不仔细考虑对方可能采取什么选择。这就是博弈论的所谓你的决策或选择并不是孤立的,而是要建立在别人的决策或选择的基础之上,反之亦然。于是囚徒的困惑就这样开始了。假设甲乙两人都十分精明,而且都只关心减少自己的刑期,并不在乎对方被判多少年,请注意这个假设,认为人都是有私心的。
甲会这样推理:假如乙不招,我只要一招供,我马上就可以获得自由,而不招却要坐牢一年。显然招比不招好;假如乙招了,我若不招,则我要坐牢20年,而招了只坐10年,显然还是以招为好。所以无论乙招认还是不招认,我的最佳选择都是招认。还是招了吧。
自然,乙也同样精明与自私,也会如此推理。于是两人都作出招供的选择。这对他们两个人个人来说都是最佳的,即最符合他们个体理性的选择。依照博弈论的说法,这是本问题的唯一平衡点。只有在这一点上,任何一人单方面改变选择,他只会得到较差的结果。而在别的点上,比如两人都拒绝的情况,都有一人可以通过单方面改变来减少自己的刑期。
也就是说,对方背叛,你也背叛将会更好些。这意味着,无论对方如何行动,如果你认为对方将合作,你背叛能得到更多;如果你认为对方将背叛,你背叛你也能得到更多。你背叛对你似乎总是好的。这是一个令人寒心的结论。
为什么聪明的囚徒,却无法得到最好的整体结果?两个人都招供,对两个人而言并不是集体的最优的选择。无论对哪个人来说,两个人都不招供,要比两个人都招供要好得多,当然这是以局外人的角度看,是能够跳出来不在其利益之中的角度看。以上就是对《囚徒困惑》的主要描述。
《30天让你精通博弈学》一书的作者接下来说,《囚徒困惑》这个问题为我们探讨合作是怎样形成的,提供了极为形象的解说,产生不良结局的原因是因为囚徒二人都基于自私的角度开始考虑选择,这导致最终合作没有产生,不能够达成集体最优解。那么接下来我们本文的讨论也就是从《囚徒困惑》这些假设条件开始的。
(待续)