熟悉而又陌生的概念——纳什定理

dcc1dbd91cc416bf6349feb9f146106d.png

(全文字数:1996字,阅读完大约需要7分钟)

哥哥姐姐弟弟妹妹们,大家好,我是王同学。

大家看过《美丽心灵》吗?这部电影是根据美国数学家约翰纳什的真实事迹改编的,约翰纳什是第一个获得诺贝尔经济学奖的数学家,获奖的原因就是他提出了纳什均衡理论,简称纳什定理。

在说什么是纳什定理之前,我们先来看一看什么是策梅洛定理。

01 | 什么是策梅洛定理

1913年,数学家策梅洛提出了一个定理,在一个两个参与者的完全信息游戏当中,一定存在一个策略,要么先手一定胜,要么后手一定胜,要么平局。

比如说,下图的这个游戏,A,B两人参与一个博弈游戏,A执先手,b执后手,A有两种选择,可以选绿色决策或者黄色决策。

图片1.png

如果A选择绿色决策,对于B而言有两种选择,一种选择结果是A获胜,另一种选择结果是B获胜,从简单的数学概率上来讲,A和B获胜的概率各是50%,但是在博弈论当中,要考虑到人性趋利避害,B不可能让A获胜,所以最后结果一定是B获胜。

如果A选择黄色决策,对于B而言有两种选择,一种选择结果是A获胜,另一种选择结果是平局,乍一看,似乎A的赢面儿很大,但是出于人性趋利避害,B一定不会让A获胜,B会选择平局。

综合以上来看,一旦A做出选择,B就会根据情况做出对自己最有利的选择,在第一种情况下,B一定会获胜,在第二种情况下两人是平局,A也很清楚B的心理。所以,游戏一开始,只要两个人都清楚规则,A一定会选择黄色决策,B一定会选择平局,游戏的结果注定是平局。

如果大家看懂了策梅洛定理,就很容易明白什么是纳什定理,因为策梅洛定理就是纳什定理的一个特殊案例。

02 | 纳什定理

纳什定理告诉我们,只要参与博弈的各方策略是有限的,那么就一定存在一种平衡状态,大家都会采用这种平衡策略,而没有单方面改变策略的动力。

130da5e3437718425a5c735c941f0be2.jpg

从单纯的数学概率角度讲,可能存在着很多种策略,而且我们可以从理论上计算出每种策略的概率,但是由于人性趋利避害,只要每个人的选择是有限的,每个人都知道自己有哪些选择以及别人有哪些选择,我们可以将整个事件的分叉树穷尽,最终找到平衡策略,也就是纳什均衡。简单的数学概率分析在实践中很难直接应用的原因就在于他没有考虑到人性的博弈。

纳什定理被广泛应用于政治,经济,以及棋类博弈。

03 | 一点思考

不管是策梅洛定理,还是纳什定理,只要参与者趋利避害,大家只有有限种选择,且参与者信息充分,最终的结果都是固定的。不同游戏的区别之处就在于分叉树的多少以及链条的长短,通过掌握足够多的信息,并且一层一层的倒退,我们就可以找到这个均衡。

古人说,多算者胜,少算者败,在这里看来,计算的就是分叉树的各种可能性,和各方可能做出的选择和不可能做出的选择。

决定我们每个人胜败的关键在于游戏的规则以及我们在游戏中所处的位置,棋类游戏是这样,人生游戏也一样。

那么,是不是注定我命由天不由我呢?也不完全是,巨大的机会在于对手的犯错,有一些对手可能是轻狂,可能是骄傲懈怠,也可能是愚蠢,总之,等待对手的犯错,对手一旦犯错,游戏会向着新的方向演化,处于游戏不利位置的个体有可能会获得超额收益。

04 | 纳什均衡的一个应用

小张和小李玩儿一个游戏,在这个游戏当中奖励是100元钱,他们可以选择向对方说真话也可以说假话,如果双方都对彼此说真话,那么两个人会平分100元奖励,如果其中一个人说假话另一个人说真话,那么说假话的人会骗走所有的钱,如果两个人彼此都说假话,每个人各亏50元。于是两个人就有四种选择。

小张说真话,小李说真话,每人收益50元;
小张说假话,小李说假话,每人收益-50元;
小张说真话,小李说假话,小张收益100元,小李收益0元;
小张说假话,小李说真话,小张收益0元,小李收益100元;

对于小张而言,如果小李说真话,自己就应该说假话独吞100元,如果小李说假话,自己说真话,这样自己的收益就是0元,对于小李而言也是同理。这个案例相比于囚徒困境更加复杂,因为参数产生了变化,所以它的答案不是确定的,所以,我们就要引入可能性。

假设,小李说真话的可能性是x,那么说假话的可能性就是1-x。

小张选择说真话的收益=50x+0*(1-x)=50x
小张选择说假话的收益=100x-50(1-x)=150x-50

很明显可以看到,当x=0.5的时候,说真话和假话,收益是一样大的,也就是说,小李说真话的可能性大于1/2,小张也应该选择说真话,小李说真话的可能性小于1/2的时候,小张应该选择说假话。

所以,从博弈论来看这个案例,诚信与否是获得更多收益的一种手段。这个模型常常被应用于分析战争,一个团体内不选择鹰派,还是格派选择对外强硬还是妥协,这些都是根据自己目的而采取的手段,起码从博弈论角度来看是这样的。

73ce31d808e7ce91d7c62a344e7b35a5.jpg

当然,纳什均衡的其他著名案例,比如,智猪博弈,囚徒困境,我们之前都已经写过,不再赘述。[1]

自知,重基础,专心致志
王同学
2023.10.28


[1] 本文案例引用自李永乐老师的视频。

版权声明:
作者:cc
链接:https://www.techfm.club/p/80031.html
来源:TechFM
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>