博弈论 博弈论 9.4分

第五课:纳什均衡、投资博弈与协调博弈

Moon Sea
提示:这篇影评可能有剧透

一、纳什均衡 (Nash equilibrium ):

纳什均衡:该集合包含每个参与人的一个已选策略,用S1* S2*一直到SM*以后,纳什均衡简写为NE,如果此博弈一共有M个参与人,纳什均衡是满足下列条件的策略组合,对于任意此集合内的参与人I,所选的策略Si*是其他参与人所选策略的最佳对策当然其他参与人的策略要用S*-i表示,也就是说每个参与人都选择了最佳的对策

两个补充:

(1)如果其他人都不改变策略,那自己改变并不会有任何好处

(2)每个参与人都不后悔这个选择

个人觉得教授的定义弱爆了,看看百度百科的定义还是直至核心:

纳什均衡的定义:在博弈G=﹛S1,…,Sn:u1,…,un﹜中,如果由各个博弈方的各一个策略组成的某个策略组合(s1*,…,sn*)中,任一博弈方i的策略si*,都是对其余博弈方策略的组合(s1*,…s*i-1,s*i+1,…,sn*)的最佳对策,也即ui(s1*,…s*i-1,si*,s*i+1,…,sn*)≥ui(s1*,…s*i-1,sij*,s*i+1,…,sn*)对任意sij∈Si都成立,则称(s1*,…,sn*)为G的一个纳什均衡。

对于下面这个博弈,它的NE(纳什均衡)是?

显示全文

一、纳什均衡 (Nash equilibrium ):

纳什均衡:该集合包含每个参与人的一个已选策略,用S1* S2*一直到SM*以后,纳什均衡简写为NE,如果此博弈一共有M个参与人,纳什均衡是满足下列条件的策略组合,对于任意此集合内的参与人I,所选的策略Si*是其他参与人所选策略的最佳对策当然其他参与人的策略要用S*-i表示,也就是说每个参与人都选择了最佳的对策

两个补充:

(1)如果其他人都不改变策略,那自己改变并不会有任何好处

(2)每个参与人都不后悔这个选择

个人觉得教授的定义弱爆了,看看百度百科的定义还是直至核心:

纳什均衡的定义:在博弈G=﹛S1,…,Sn:u1,…,un﹜中,如果由各个博弈方的各一个策略组成的某个策略组合(s1*,…,sn*)中,任一博弈方i的策略si*,都是对其余博弈方策略的组合(s1*,…s*i-1,s*i+1,…,sn*)的最佳对策,也即ui(s1*,…s*i-1,si*,s*i+1,…,sn*)≥ui(s1*,…s*i-1,sij*,s*i+1,…,sn*)对任意sij∈Si都成立,则称(s1*,…,sn*)为G的一个纳什均衡。

对于下面这个博弈,它的NE(纳什均衡)是?

BR1(l)= M BR2(U)= l

BR1(c)= U BR2(M)= c

BR1(r)= D BR2(D)= r

在图上圈出各个博弈的BR,可以得到下图

根据NE的定义可知,这个博弈的NE即为S=(D,r)

有时候纳什均衡的结果并不唯一,不如下图:

可以发现,在这个博弈中的NE有两个(U,l)和(D,r)

二、投资博弈(The Investment Game):

假设: 你们参与投资游戏

(1)你们可以选择投资,也可以选择不投资;投资是10美元

(2)当你选择不投资,你不会有收益;当你选择投资时,如果你们中超过90%的人选择了投资,那么你会得到50%投资本金的回报,如果你们投资的人数没有超过90%,那么你会损失掉投资的10美元

就像在课堂中的表现,有人投资,也有人没有投资。

这个博弈其实有两个纳什均衡:要么大家全部投资;要么大家没有一个人投资。

怎样找到这个博弈的纳什均衡?

将投资的人数比例设为一个条件,将我们的选项变为投资U,与不投资D,s1为我们的选项,s2为其他人的选择

最终的结果可能是如下图:

当投资不满足0%~90%时,博弈如图

当参与人》90%时,博弈如图:

这样,两个纳什均衡就出现了。

当老师将这个投资博弈反复进行时,他发现,人们最后趋向于都不投资的NE,而不是另一个都投资?为什么?

这可能与投资的初始条件,(即上一轮有多少人参与投资),当投资初始条件低于90%很多时,不停的重复博弈,会导致没有人投资;当初始条件高于90%时,则会导致人们都选择投资。

那么当初始条件位于70%~90%时,会怎么样?我们不知道答案。

这只是反映了初始条件肯能很重要,但具体事实如何,我们很难预测这么相近的条件。

三、协调博弈( Coordination Game ):

协调博弈就像上面的投资博弈一样,当我们都选择好的合作时,结果会变得很好;但是当我们都选择不合作时,结果可能很糟或谁也不会有溢出。

课堂上的讲的几个 Coordination Game 较好的例子是:校园聚会 —— 当有很多人参加时,聚会会变得热闹有趣,但是如果参加人数很少时,就会很无聊,而使得大家以后对这个不感兴趣。

老师举得的另一个例子是银行挤兑现象(Bank Run),指大家对某个银行失去信心,进而排队取钱,导致这个银行真的破产的现象。这里,如果大家都相信银行,把钱存到这里,从而使得银行能够放贷,刺激经济,增加就业....经济状况就很好。但是当大家都不相信时,银行就破产了。

协调博弈(Coordination Game)和囚徒困境的区别:

协调博弈本质上存在两个纳什均衡的状况,人们选择了某个,如果要让人们选择好的纳什均衡,那么只需要和其他人沟通,就可以改善;

但是囚徒困境不行,它有严格优势策略,沟通并不会导致结果发生改变,它的博弈是非合作的。只有改变收益状况,签立社会契约,才能改善。

0
0

查看更多豆瓣高分电影电视剧

回应(0)

添加回应

博弈论的更多影评

推荐博弈论的豆列

了解更多电影信息

值得一读

    豆瓣
    我们的精神角落
    免费下载 iOS / Android 版客户端
    App 内打开