博弈是什么意思(零和博弈是什么意思?)

qinzhiqiang 08-14 16:10 2,214次浏览

习总书记在庆祝中国共产党成立一百周年大会上的讲话中,论及外交政策和国际关系时,提出了“三个坚持”和“三个不搞”:坚持合作、不搞对抗,坚持开放、不搞封闭,坚持互利共赢、不搞零和博弈。

这里,什么是零和博弈呢?

在博弈论中,零和博弈(zero-sum game)也叫严格竞争博弈。在这样的博弈中,不存在任何类型的合作或联合行动:每个参与人的偏好是完全相反的,一个人所偏爱的结果恰好就是另一个人最不愿看到的结果;每个参与人的利益是完全对抗的,一个人所得必然是另一个人的所失。

其实从零和博弈的名字就容易理解上述性质。之所以叫零和博弈,就是由于博弈双方(也可以是多方)的得失之和等于零。得失之和等于零,其实就是说一方有所得,另一方就必须有所失。所以,零和博弈的通俗理解,就是你死我活的斗争

大多数的赌博游戏都是零和博弈。比如下象棋,或者打扑克,又或者“剪刀-石头-布”游戏,都是零和博弈。这些游戏中不存在共赢的结果。

有些博弈中,参与人的赢利之和加起来并不是零,而是一个常数。这叫做常和博弈(constant-sum game)。常和博弈,本质上仍是零和博弈——倘若将某个参与人的所有赢利数字都增加或扣减同一个数字,该博弈的性质没有任何变化,那么我们只需要剪去博弈的“常和”值,便可将一个常和博弈改变为零和博弈,而它们的性质是一样的。在参与人所有赢利值上加上或减去一个常数,不改变博弈的性质,其原因在于:赢利值代表的是参与人的偏好,决定偏好的是数值的相对结构,而不是数值的绝对大小。故常和博弈与零和博弈一样,也是严格竞争的,双方利益是完全冲突的。而分析零和博弈的方法,对于分析常和博弈也是适用的。

在1928年(这一年正好是约翰・纳什出生之年),数学家冯・诺伊曼提出了最小最大定理(更准确地说,应该是最小值的最大化),来分析二人零和博弈,推测其均衡结果。最小最大定理的核心思想可以这样直观理解:针对我的每一个选择,对手都一定会尝试最大化他的所得(从而会令我的所得最小化——因为他的所得正是我的所失);我的每一个选择所对应的可能结果中都有一个最小价值,而我的最佳选择,就是在这一系列最小价值中选择最大的那个。根据这一原理得到的推测结果,叫最小最大均衡。

下面通过二人零和博弈的一个例子来说明最小最大均衡,如下(参与人及其赢利已用不同颜色对应):“不搞零和博弈”,什么是零和博弈?

零和博弈例子

寻找这个博弈的最小最大均衡的思路是这样的。以A为例,他的想法是:如果我选择上,那么我最糟糕的结果是得到-2;如果我选择下,那么我最糟糕的结果是得到-1;在这两个最糟糕的结果中,-1是最不糟糕的(最大的最小值),所以我应该选下;而对方会选右。所以最后的结果将是(下,右)。

如果以B为例来分析,最小最大定理意味着B将这样思考:如果我选择左,那么我最糟糕的结果是得到-2;如果我选择右,我最糟糕的结果是得到1;两个最糟糕的结果中最大的是1,是我选右可以至少确保1,所以我选择右;而我的对手,将会选择下。所以结果跟以A为例的分析一样,也是(下,右)。这并非偶然,事实上无论从哪一方分析,得到的结果总是一样的。

从以上分析中,可以看到,博弈的参与人实际上类似于采取了悲观决策方式:我从自己所有的糟糕结果中,选择最不糟糕的那一个。这样做,我的后悔就会最少。因此,最小最大均衡,有时也被叫做最小后悔的均衡。

后来,23年之后,约翰・纳什(前面已提过此人,还记得他出生在哪一年吗)提出了一个新的均衡概念,后来称作纳什均衡。纳什均衡建立在参与人最优反应行为基础上。仍然以前面的零和博弈为例,它的推理是这样的:A认为,当B选择左的时候自己选择下最有利,当B选择右时自己选择下也最有利,所以无论B选择什么自己最好都选下;B认为,当A选择上的时候自己选择右最有利,当A选择下的时候自己还是选择右最有利,所以无论A怎么选自己都选择右就最好。结果,A选择下,B选择右,这就是纳什均衡。

在这个例子中,最小最大均衡和纳什均衡是同一个。这也不是偶然。实际上,在零和博弈中,最小最大均衡和纳什均衡是等价的。

但是,零和博弈并非常态。有许多博弈,双方的赢利之和并不为零(或某个常数)此类博弈叫非零和博弈。

非零和博弈中,最小最大均衡和纳什均衡所推测的博弈结果通常是不一样的。下面我们构造了一个非零和博弈的例子(显然,右下角是共赢结果,因为每个人可得到4,这是每个人所能达到的最高价值)。“不搞零和博弈”,什么是零和博弈?

非零和博弈例子

在这个新的例子中,如果运用纳什均衡的推理思路,那么,A对B的最优反应是:B选择左自己就选上,B选右自己就选下。而B对A的最优反应是:A选上自己就选右,A选下自己还是选右。纳什均衡结果是:A选择下,B选择右。他们实现了“共赢”。

如果运用最小最大原理,会得到什么结果?从A的立场来看,他发现:若选上,最糟糕的是-1,若选下,最糟糕的结果是-2,故自己应选上。从B的立场看,他发现:若选左,最糟糕结果是-3,若选右,最糟糕结果是-2,故自己选右。结果就是A选上,B选右——这是一个双方都亏损的结果。而且也不合常理:如果A是理性的,当他发现B选右,他就会后悔自己为什么没有选下。这个例子说明,用零和博弈的思路去推理非零和博弈,是有问题的。

实际上,最小最大原理,只能适用于零和博弈。纳什均衡原理,既可以适用于零和博弈,也可适用于非零和博弈。也因此,纳什均衡成为了现代(非合作)博弈理论的核心。人们基本上不再提及最小最大原理(但最小最大原理本身仍不应被忽视,它虽然不再是博弈论的核心,但仍然是极为重要的基石)。

这个世界绝大多数的经济和政治活动中,结果都不是零和的。人类社会存在诸多合作,合作的结果通常都不是零和的,共赢也可以存在。如果用零和博弈的思维去面对非零和博弈问题,结果就难以实现共赢,甚至可能出现损人不利己(如上面例子中的“双亏”结果)。总书记提出“坚持合作、不搞对抗,坚持开放、不搞封闭,坚持互利共赢、不搞零和博弈”,是高瞻远瞩的战略智慧,也是奉行独立自主的和平外交政策,坚持走和平发展道路的基本原则。