博弈论 博弈论 9.4分

第四课:点球博弈、合伙人博弈与纳什均衡

Moon Sea
2017-07-27 07:28:50
提示:这篇影评可能有剧透

一、点球博弈

图中,l和r分别表示守门员的选择,向左(left)和向右(right),同理,L、M和R分别代表罚球运动员能够选择的策略,左/中/右。

数字表示能够罚进的概率,负表示罚失败的概率。

为了最大化进球,即 Max Eu1(si,s-i)

作出上一节我们讲到的求最佳策略(Best Response)图像

横坐标P(r)表示守门员扑向右侧的概率从0~100%的连续变化,纵坐标表示Eui(si,s-i)

奇怪的是:当我们引入这个图像时,原本并不存在劣势策略的选择中路,变成了劣势策略——因为随着P(r)的变化,选择收益最大要么是向右,要么向左(分界是P(r)=1|2)

所以这个模型的优势策略便是,当你认为守门远向右扑的概率

...
显示全文

一、点球博弈

图中,l和r分别表示守门员的选择,向左(left)和向右(right),同理,L、M和R分别代表罚球运动员能够选择的策略,左/中/右。

数字表示能够罚进的概率,负表示罚失败的概率。

为了最大化进球,即 Max Eu1(si,s-i)

作出上一节我们讲到的求最佳策略(Best Response)图像

横坐标P(r)表示守门员扑向右侧的概率从0~100%的连续变化,纵坐标表示Eui(si,s-i)

奇怪的是:当我们引入这个图像时,原本并不存在劣势策略的选择中路,变成了劣势策略——因为随着P(r)的变化,选择收益最大要么是向右,要么向左(分界是P(r)=1|2)

所以这个模型的优势策略便是,当你认为守门远向右扑的概率低于50%时,向右踢;当你认为守门员向右扑的概率高于50%,向左踢(为什么我感觉这个结论很废话.....)

探讨这个模型的不足:

(1) 这个模型没有考虑守门员居中不动的状况,那么加入后会有什么变化呢?(想知道吗?不好意思,课后作业...)

(2)没有考虑左右脚球球员,他们踢向左向右时命中率不一样

(3)没有考虑球速与精度,比如某些球员喜欢大力出奇迹,往往会选择中路,因为他们精度不怎么样。但这与我们的Best Response相反,我们认为中路是始终的劣势。但是加入精度和球速的考虑后,因为中路的进球效率始终恒定(在图中是6),但是对于那些精度不怎么样的球员,也许他们踢中路的命中率远高于踢边路,事实上会让他们提高自己的命中率,比如提高到8。

如果我们在原图中插入一条为8的线段,Best Resonse 就会发生很重要的变化

二、合伙人博弈(Partnership Game):

给定假设:

(1). 你们均分利润

(2). 你们的收益由你们投入的精力决定,这里精力即为投入的时间t ,我们用0~4来标记你们选用的时间,即Si∈[0,4]

(3)你们的利润的表达公式为: 4 [ s1+s2+bs1s2 ] ,其中,0≤ b ≤ 1/4

所以,我们能够得出两者的收益(Payoffs)分别为:

u1(s1,s2) = 1/2 [ 4 ( s1+s2+bs1s2 ) ] - s1 s1

u2(s2,s1) = 1/2 [ 4 ( s2+s1+bs2s1 ) ] - s2 s2

我们怎样算出收益人的Best Reponse呢?

对他们的收益求s1的导数,(这里用到的是微积分的知识,微积分!天知道他说这个时候我说多么一脸蒙蔽,早忘了....)

u1(s1,s2) = 1/2 [ 4 ( s1+s2+bs1s2 ) ] - s1 s1

对它进行求导可得:

一级导数 foc : 2(1+ b s2)-2s1

二级导数 soc: -2

求二级导数,是为了确认:最大值处的2级导数是负数。(好像有点印象....柯西、拉客朗日神马的....)

则,另 2(1+ b s2)-2s1 = 0 使得 u1(s1,s2) 达到最大,、

有 Best Reponse

BR1(s2)= 1 + bs2

同理,可得

BR2(s1)= 1 + bs1

再然后,因为0≤ b ≤ 1/4,我们给出 b = 1/4 时两者的图像:

关于这个相交的点,我们称为纳什均衡( Nash equilibrium )

1
0

查看更多豆瓣高分电影电视剧

回应(0)

添加回应

博弈论的更多影评

推荐博弈论的豆列

了解更多电影信息

豆瓣正在热议

豆瓣
我们的精神角落
免费下载 iOS / Android 版客户端
App 内打开