晏星皓教授 | 博弈?合作?商业中的游戏规则

编者按

什么是博弈博弈的精髓是什么?

什么是“囚徒困境”?

如何进行博弈的分析?

博弈如何应用在商业?

博弈关系的根本逻辑是什么?

请听Kepha学院MBA项目运营与供应链管理客座教授晏星皓教授为我们带来的讲座——《博弈?合作?商业中的游戏规则》。

01. 什么是博弈——博弈的精髓就是考虑到对手策略

博弈的本意就是下棋,现实生活里面除了这些棋类以外,还有没有别的博弈?怎么去看这个问题?我举三个例子让大家看看。

第一个例子,田忌赛马。在战国时代齐国有一个大将叫田忌,经常跟齐国的公子们一起赛马,但是田忌老输。赛马的规则就是赛三场,派不同等级的马去赛,马因为脚力不一样,就分上中等三个等级,赛三场,如果赢了两场,整场比赛就赢了。孙膑就给田忌建议,上等马的比赛,拿你的中等马跟他们比,中等马的比赛,拿你的上等马去比,下等马的比赛,就拿中等马跟对方的下等马去比。那么你不管怎么比,你的马总是比对方的马有两场是更占优势,所以你总能以2:1取胜。田径赛马是不是博弈?

第二个例子,尤塞恩博尔特。尤塞恩博尔特是曾经世界的百米之王,他有一张照片是取自于大概2006年在世锦赛上一个比赛的场景,快到终点胜券在握的时刻。他做了个著名的姿势叫犀牛望月,望背后的竞争对手是不是赶上来了。这个例子是不是一个博弈? 

第三个例子是买股票。许多人有投资股票的经历,买股票前,你可能要先去看一下股价的变动,根据股价的走势来决定要不要买某只股票。那么你的决策是博弈吗?

以上三个例子中,很多人觉得田忌赛马是博弈,然而并不是。博弈是多个玩家在一起玩的游戏,你的决策肯定是你想赢,比如在田忌赛马里面,你要根据对方的情况,根据整个比赛的情况去制定你的决策。但是同样的道理,博弈论这里面的所有的这些特性是,如果你这么想,那对手也会这么想,对手他不可能任你摆布,对手也不可能是傻子。如果你有这种想法,对手也一样会有这种想法。你以为这个东西按照你的布局就很好了,对手又何尝不会这么想呢,如果你在这个游戏里面觉得对手就任你摆布的话,这个不是博弈,博弈是所有玩家都按照理性的思考去决定他们的自由决策。如果你有这样的想法,这时候对手也应该有这样的想法。

第二个短跑的例子,它为什么是博弈?当尤赛恩博尔特回头看的时候,其实他的决策是那个时候他要不要继续拼命的跑?还是说他觉得他就够了,为什么?因为他确保他能胜利的时候,他就不会竭尽全力了,所以他的决策是依赖于对手的情况。对手其实也是一样,他在前面要不要追?要追,而且要拼命追,所以每一个运动员,每一个百米跑的运动员都在根据对方的情况,对方的策略来决定他当下的策略,这就是一个博弈。

同样的买股票也是博弈。股价如果上涨,也就是说大家都对这支股票都看好的情况下,都会去投资,大家都会投资的话,那么股价就会上涨。反过来如果大家都对这个股票不感兴趣,大家都不买了,而且要清仓了,股价就会暴跌。所以股价的变化其实就是所有的投资者在这样一个投资股票的博弈里面,他们的决策所产生的这样一个结果。所以你的决策是要根据对手情况而定的,因为你要看股价,股价又是所有的股民对股票的决策一起来决定的,所以就是一个博弈。

所以我们看到博弈的精髓就是考虑到对手策略,而且这个精髓是所有的玩家,而不是单你一方,是所有的玩家都要这样去思考,才会产生的这样一个游戏规则,这个叫博弈。博弈一定有三个方面的一个要素,第一个有多个玩家。第二就是每个玩家他必须要有个策略,第三个要素就是你的收益,一定要有结果。

02. 囚徒困境?—如何分析博弈?

2.1 博弈的解

每方的收益取决于所有玩家的策略,这是博弈的基本的特点。每方玩家的策略都是基于其他玩家策略的自由选择,因为这个结果就是说每方玩家都有一个最优策略。每个玩家的最优的策略选择就叫做这个博弈的解,博弈的解有一个更加高级的名字叫纳什的均衡解。

关于博弈论,我们主要还是看应用,到底怎么去解。最终你怎么去定每个玩家的解呢?我给大家讲一个著名的囚徒困境的例子。

有两个嫌疑犯,他们可能是一个黑社会团伙,一个警察把他们逮着了,让他们做选择:是把对方招认出来,还是不把对方招认出来? 警察把两个人分别关到两个小黑屋里面,不能商量, 10分钟之后,说出他们的决定。招还是不招?怎么定他们最后的结果?现在玩家有了,两个玩家,每方都有两个决策——招还是不招,最后的收益是什么?博弈结果是什么?结果怎么定?警察写了三种情况下的处罚结果:第一种,如果一个人招一个人不招,招的这个人立功得释放,不招的这个人他就入狱5年;第二种,如果两个人都招认了,每个人判3年;第三种,两个人都不招认,每个人就判一年。是招还是不招?这就是一个博弈。

2.2 博弈的分析

到底博弈怎么分析好?难点就在于,如果我是甲,我是招还是不招?招对我好,还是不招对我好?但同时矛盾在于,如果我招了,我的结果还不确定。因为我的结果就取决于乙的决定,这就很难了。乙的这个决策我也不能控制,这就是悖论了。

分析的方法就是这样,我从甲的角度上去考虑。我的难点是我不能控制乙的决策,但是我还可以假定如果乙已招认,我就有两个结果,这个可以取决于我了。如果我招认我就判3年,如果我不招认我就判5年,哪个决策对我更好?当然判3年更好,相比来讲,我当然不希望把在牢里多待两年对吧?所以如果乙招认的情况下,招认对我来说是更好的一个决策。

当然还要分析如果乙不招认的情况。同样的道理,如果乙不招认我还是有两个结果,第一,如果我招认就被释放,如果我不招认,我得判一年,哪个更好?还是招认更好,这说明什么问题?即便我不能控制乙的策略,但是通过假设分析,我知道不管乙怎么样,招认对我来说总是最好的,总是更好的。所以对于乙方来讲,他的最优策略是什么?肯定是招认。博弈论不是每个玩家都要去决策吗?如果甲这样想,乙也会根据一样的逻辑去想。

所以他们两个人都会选择招认,这就是博弈的结果,我也考虑着每方的收益都跟对方的决策有关,然后我都用假设分析去分析,最后发现招认对每方来讲都是最好的一个决策,所以这个最后的决策所谓的纳什的均衡解就是两个人都招认,这就是所谓的囚徒困境的故事,它从一个侧面告诉我们怎么样去分析博弈。

03. 囚徒的困境——自我中心的决策逻辑

“囚徒困境”中的囚徒为什么存在困境?又有怎样的困境?

3.1 困境一

最后的纳什的均衡解都是两个人都招认,两人招认两个人都坐牢三年,这就最后的结果。但是问题是如果仔细去看一下这个游戏规则,假设两个家伙他都不招认,按照这个游戏规则,两个人只需要各入狱一年。显然下面这种情况对他们来讲是更好的。但是现实是他们不会这样去选择,后面那个情况其实是双赢,但是他们还是会选择双输,这就是困境。

明明他们如果选择不招认就可以双赢,但是双赢就像镜花水月一样,是几乎不可能够实现的美好愿望。只有一个原因,就是自我中心的决策逻辑。我很慷慨,希望双赢,坐一年牢就可以了,所以我不招认,而我希望你也这么想。但可惜乙没有我这么慷慨大方,没这么无私,如果他知道你不招认,他知道如果他选择招认,他就会被释放,坐牢都不用了,他肯定就选择招认。如果你招认他不招认那他就惨了,他坐牢时间更长了,所以他干嘛要选择不招认?

所以这就是自私,就是人的自我中心的决策逻辑,除非你强硬改变这个游戏规则,比方说他们俩都是黑社会对吧?黑社会老大突然托人给他俩捎了一句话:如果你招认对方,我杀你全家,那就不一样了,这个游戏规则就陡然而变了。所以他们两个肯定会选择不招认,除非是你改变这个游戏规则,但是你再改变游戏规则结果,自我中心这个东西的逻辑决策是不变的,这就是困境之一,因为人的自私导致他走不出这个困境,他拿不到双赢的结果,它只会导致双输。

3.2 困境二

不管对方决策怎么样,每方招认他总是更优的一个结果。就是说刚才用的假设分析,不管乙怎么决策,对于甲来讲,招认总是一个最好的结果。但是这只是最简单的博弈的情况。你不管怎么分析对方的决策,对于任何一方来讲,总有一个决策永远是最好的,这种情况是一个非常理想的状态,一般情况下在博弈里面这种现象是不存在的,就是不可能存在一个决策对于某一方来讲永远是最好。

那么如果在那种情况下怎么分析?那就很难了。我们回到博弈的最后的解即纳什的均衡解,纳什的均衡解的本质是什么?是任何一方的玩家的决策都是基于其他玩家的决策,就是说,如果你这样选我这样选对我来讲是最好的,这条对于所有玩家都成立,所以它的决策本质就是玩家的决策稳定,谁也不会脱离。因为每一方的这个决策都是基于所有对手的决策的自由决策,所以没有一个人会脱离这种情况。

有的时候这种解根本就不存在。就是基于对手的决策,你的是最好的,然后所有的决策都满足这个特性。

04. 博弈如何应用在商业?

博弈对于我们来讲更关键的是它的应用,怎么在商业里面去应用它。商业里的博弈我大概把它分为两类,这两类是根据什么?因为博弈就是玩家跟各个公司企业之间的关系,这两类就是根据这个关系的不同定下来的。

4.1 纵向竞争关系:一损俱损,一荣俱荣

一个产品制造出来,它必须要有上游的供应商提供原材料和零部件,它必须还有下游企业,零售商,假设有三个企业或者公司在供应链里面是从上而下的这样一个纵向的关系,这个就叫纵向关系的一个博弈。

他们之间都要做决策,供应商、制造商、零售商这三个玩家,都各有策略。供应商要定它的原材料准备多少,零部件要生产多少,质量是多少。制造商要决定这个产品最后的质量和数量。它卖给零售商的批发价,零售商当然要决定它进货多少,最后的零售价定在什么地方,都有决策,这是博弈的第二个要素。第三个要素是他们的收益就是每方的利润,他们的收益跟他自己的决策有关系,同时跟上下游的企业的决策也有关系,所以他们之间的决策是互相影响,当然也是一个博弈。

所以在供应链里面上下游企业之间互相供应,他们的决策互相影响,而且他们的决策是按照先后的次序来进行。纵向的供应链的博弈本质就是,每方都承担整个过程的一部分,只有把所有的部分都完成了,一个产品的整个的商业过程才能够完成,缺少其中任何一环整个过程就不能进行。这就是纵向关系的企业之间的关系,游戏的规则就是一损俱损,一荣俱荣。

纵向竞争关系本质上就是把蛋糕做大和分蛋糕的问题。先把蛋糕做得最大,还是先讲好怎么分这个蛋糕,这是个著名的问题。这个问题的本质是什么?就是说我的这个决策的思路,目标首先是要把蛋糕做大,你要做大蛋糕,必须要准备好做大蛋糕的资源,材料、劳力、成本都安排好,我就奔着做把这个蛋糕最大化目标而去,这叫做大蛋糕。

分蛋糕就是说先不要管这个蛋糕会做到多大,如果你想要最后的结果是蛋糕最大的话,你先做的东西是不是为了那个目标,你先做的事情是不是我们之间怎么合作?我认为从博弈的角度上来看的话,分蛋糕是最重要的,分蛋糕是要先去做的。因为分蛋糕其实就是一个定合作关系,定合作关系也就是定你的博弈的规则,你把博弈的规则先定好,规则定好了才会有博弈的结果。

4.2 横向关系的博弈:零和博弈,价格战

横向关系指处于供应链同一层的几个不同的企业和公司之间的关系。市面上有多家不同的供应商,他们之间就要为制造商的订单去竞争。

横向关系的博弈有好几种,最恐怖的就是零和博弈,如果你赚钱了我就赔钱,如果你活了我就死了,这个叫零和,就是说每个玩家的收益的总和加起来是等于0,与此相对的正和就是玩家的收益加起来是一个正数。

彭博社今年出了两篇报道,都是关于电子销售商巨头在美国的亚马逊公司。第一个报道是说亚马逊今年的出售的商品,它的平均价格比在市面上的竞争对手,比方说沃尔玛,比方说target,中文叫靶子店,平均价格要低13%,这就是价格战。

价格战其实就是一个恶性的竞争,为什么?因为有零和博弈,因为有固定的正和博弈,资源就那么多,饼就那么大,你要想吃更多,你就必须要付出一个代价,这个代价就是降价。所以亚马逊因为它的总体的容量大,它的成本控制得非常好,它的物流各方面做得非常强,所以它有成本优势,成本优势就给了亚马逊在美国跟它的同类的竞争对手更多的空间去降价。

第二篇报道是亚马逊考虑的竞争对手是谁?因为拼多多进入美国市场,亚马逊就出了一个官方的证明,表明拒绝跟拼多多展开价格战,拒绝跟拼多多的同类产品的价格做比较。

亚马逊公司接下来的反应就是,本身提供一个非常强大的搜索功能,顾客在亚马逊的网站上可以去搜索这个同类产品在各大不同的销售平台上的价格,然后做比较,他把拼多多从中去掉了,以此表明拒绝跟拼多多发生价格战。

这两个例子本质上都是价格战。第一种情况下,亚马逊参与这个价格战,而且也定了一个更加低的价格,因为他很清楚它是可以赢的那一方。他也很清楚,如果他把这个价格压低3%,他就会拿到更多的市场份额,它的利润就会更大。也就是说价格战的好处和利益它是可以拿到的。

而在第二个例子里面,它很清楚,跟另外一个竞争对手拼多多相比,他是价格战的输方,他赢不了,25块钱跟5块钱怎么比?如果他死磕下去的话,最后死的就是他。所以他选择拒绝,并以更加高大上的一个方式去解决。

05. 改善博弈结构的方式:分配,竞争与合作

以上两个例子反映出来价格战本身的特点其实就是一个恶性竞争。横向关系的竞争博弈非常恐怖,有没有一个办法从零和或者是个固定的正和变到一个更好的博弈的情况?有的。

5.1 分配

分配是什么意思?刚才说资源有限,你拿了别人就没有了,零和更恐怖更极端,就是你拿到所有的,另外一方就是全输,啥也得不到。举一个例子就是说美国的汽车行业有一条法规,这个我去研究过,它的汽车制造商是有很多的供应商的,大家都知道,多个供应商生产某个零部件对吧?美国的汽车行业一个法规它怎么规定?比方如果你现在在这个地区,这个汽车制造商有三家不同的供应商为你服务,法律规定,你必须要把订单都给这三家,而且每方订单的规模都要在一个底线之上。

假设三家供应商,你把你的订单只给其中的一家或两家你是犯法的,你是违法的,这个就清楚了,这个叫分配。它是遏制恶性竞争,使得某一方或者某几方占用了其中的大部分资源的这样一个极端情况出现,这个是有利于整个行业发展,这是由法规介入分配,这是第一个解决方案。

5.2 合作竞争

比如你去亚马逊上买东西,在亚马逊买过东西的人都可以看到,它其实跟很多小规模的销售商是有很多的合作的,零售商去合作,它就是说亚马逊允许这些小规模的零售商用他们的平台去卖他们的产品,不是亚马逊直接卖,是他们去卖,但是亚马逊给他们平台,因为亚马逊跟他们其实也是竞争关系,但是他们在这个角度上他们合作了,但这个合作是双赢的,显然是双赢了,因为对于小的零售商来讲,有这么大好的一个平台去卖东西,何乐不为?

然后另一面对亚马逊来说也是双赢的,因为小零售商拉进来以后,大家因为一直在亚马逊上买,你买我的东西就可能买别的东西,我们都受益,所以合作竞争其实现在也是一个公司自己去解决恶性竞争的一个方式。但是这样的合作也是有限的,横向关系的博弈还是很恐怖,为什么?我们还是回到亚马逊这个例子,虽然它跟小型的销售商有合作竞争关系,但是它跟大的竞争对手,比方说沃尔玛、靶子店,他就不会这样去做了,为什么?因为他们直接威胁到他的市场份额,所以即便是在竞争里面可能合作,但这种合作也是非常有限的。

因为其实归根结底还是一个原因,就是公司要维护自己的利润。所以改善博弈的结构,终归是有限的。

06. 博弈关系的根本逻辑就是人以自我为中心

竞争关系、博弈关系根本逻辑就是人以自我为中心,因为每个人都有限,所以他要争取资源,它就必须要自我中心。

所以要改变这个根本结果的话,除非你改变自己的目标,你不再以自我为中心,然后才可能从根本上去改变这个游戏规则。这个话说来好听,在现实有可能吗?

6.1 农夫和蛇的故事

一个农民很善良,出于善心救了蛇,结果反被蛇咬死了。农夫和蛇,我认为也是个博弈。

因为对老农来讲,他其实有两个选择,救和不救。如果我们按照博弈规则去思考,如果农夫以自我为中心的价值观去做决策的话,当然是不救,但是农夫他其实选择了一个不是以自我利益为中心的一个价值观去做决策对不对?他是反其道而行,他救了这个毒蛇了,但是结果却很惨。

6.2 亚伯拉罕和罗得的故事

以色列人的祖先亚伯拉罕和他的侄子罗得这两个家族,他们要迁移一个新的地方去,他们的产业就是羊,羊要吃草,所以需要水草丰盛的地方。因为彼此家族都很大,各自的羊也很多,于是牧人之间就起了纷争,最后不得不分开,怎么分?谁先选择这也是博弈。

如果我们按照人的逻辑,以自我中心的逻辑去思考的话,对于亚伯拉罕来讲,他的逻辑就是很自然,他是长辈,所以他肯定要先选,选择草更好的地方,但是他没有这么做,他反其道而行,他放弃了自我利益为中心的价值观去做决策了,他反而用了一个利他的价值观去做决策,让罗得先选,让人很感动。

而罗得没有客气,他是按自我中心的利益来做决策的,就选了一个青草肥美的平原。我们后来发现罗得选的这个地方,他没有考虑到这个地方所多玛和俄摩拉两个城城市罪恶滔天,最后被上帝毁灭了,他们一家也不得不逃出来。所以看似一个好的选择,但是结局却不好。

亚伯拉罕看似一个不好的策略,最后他被上帝祝福,并成为万民的祝福。这两个故事,其实逻辑还是很相似的,都是博弈的某一方他放弃了自我利益为中心的价值观做决策,第一个故事结果却很惨,第二故事结果却很好,为什么?如果我们要以一个不一样的博弈的价值关系做决策的话,在现实里面能不能实行?这两种截然相反的结果给了我们什么样的启示呢?我个人的感想是:

6.3 启示一:合一

启示之一,第二个故事里,如果你放弃了自我利益为中心的价值观的话,除非有一个外来的第三方的力量介入博弈,能够保证牺牲自我利益者的利益,这个牺牲的玩家才有动机做这样一个选择。比方说第二个故事里面这个力量是有的,这个力量不是来自亚伯拉罕自己,也不是来自于罗得,是来自第三方,就是上帝。但是可惜第一个故事里面农夫与蛇里面是没有的,没有人去保证农夫的利益,毒蛇想干嘛就干嘛,所以结果就不好。如果这个时候有第三方力量介入的话,如果这个玩家去放弃了牺牲自我利益者的价值观去做博弈的话,这个博弈也就不再是博弈了,这个博弈已经不复存在了。

这个博弈叫合一。合一什么意思?大家都不是以自我利益为中心的话,那都是利他,利他就是利总体,利总体不就是合一?即大家目标都一致的。

6.4 启示二:不要让牺牲自我的策略给恶造成一个可能的出口

在农夫与蛇的故事里面,农夫完全可以把蛇装在一个笼子里,为什么不这么做?你为什么要把蛇救回来还放你旁边?

有一句很有智慧的话,就是说你可以驯良如鸽子,也可以灵巧如蛇,两个缺一不可。你可以驯良,你可以去利他,但是你要防止恶人,你要灵巧得跟蛇一样,你要想办法去保护自己,这两个东西不是矛盾的,是可以同时去做的。

所以,博弈到底是人的问题,因为人的有限或者是自我中心,最后它都不可能自发地导致一个好的结果。人们看到了这个问题,也想尽办法去扭转这个局面。但是不管人想什么办法,因为人的本质是不会变的,所以博弈的改善它终归是有限的。

注:文章中涉及的立场,仅代表嘉宾的个人观点,不代表本学院的立场和观点。

作者简介
MBA 项目运营与供应链管理 客座教授
  • 美国普渡大学管理学院定量方法和管理科学博士,南开大学自动控制硕士
  • 现任Kepha学院MBA项目运营与供应链管理客座教授
  • 目前是美国托莱多大学商学院副教授,曾任加拿大西安大略大学毅伟商学院助理教授
  • 主要研究方向为供应链管理。其研究成果发表在很多国际顶尖及权威学术期刊上
  • 具有二十多年的教学经验,擅长案例教学