留学指南网

您好,欢迎访问留学指南网,我们将竭诚为您服务!

混合策略纳什均衡,什么是纳什均衡理论?

2024-03-28 18:20分类: 国际预科留学 阅读:

1、什么是纳什均衡理论?

纳什均衡又称非合作博弈均衡,是博弈论中的一个重要术语,以约翰·纳什的名字命名。在博弈过程中,无论对方的战略选择是什么,一方都会选择一定的战略,这就叫主导战略。如果两个博弈者的战略组合构成各自的主导战略,则该组合被定义为纳什均衡。

当每个球员的平衡策略是达到其预期收益的最大值时,一个策略组合被称为纳什均衡,同时,所有其他球员遵循这一策略。

纳什均衡可分为两类:纯战略纳什均衡和混合战略纳什均衡。

要解释纯策略纳什均衡和混合策略纳什均衡,首先要解释纯策略和混合策略。

所谓纯策略,就是为玩家提供一个完整的游戏定义。特别是,纯粹的策略决定了在任何情况下都要进行的运动,策略集合是玩家可以执行的纯策略集合。

混合策略是通过给每一个纯策略分配一个概率而形成的策略,混合策略允许玩家随机选择纯策略,在混合策略博弈的均衡中,由于每个策略都是随机的,当达到一定的概率时,就可以得到最优支付。由于概率是连续的,即使策略集是有限的,也会有无限的混合策略。

当然,严格地说,每个纯策略都是一个“退化”混合策略,一个特定纯策略的概率为1,另一个为0。

因此,“纯战略纳什均衡”是指所有参与者都玩纯战略,而相应的“混合战略纳什均衡”则是指至少有一个参与者玩混合战略。并不是每一个博弈都会有纯战略纳什均衡,比如“硬币问题”只有混合战略纳什均衡,而不是纯战略纳什均衡。

然而,仍有许多博弈具有纯战略纳什均衡(如协调博弈、囚徒困境博弈和鹿博弈)。甚至,有些游戏可以同时拥有纯策略和混合策略平衡。

来源;百度百科——纳什平衡

混合策略纳什均衡,什么是纳什均衡理论?

2、怎么求混合策略纳什均衡

混合策略均衡求解的一个原则是混合策略均衡赋予正概率的所有纯策略的期望收益相等。

假设这是个两个玩家的游戏。

玩家a有2种纯策略a和b,不能相互支配。

玩家b有2种纯策略c和d,不能相互支配。

设a选a的几率是p,则选b的几率为1-p;设b选c的几率是q,则选d的几率为1-q

当a取某一个p=p0,b获得的总效用不为自己q的取值而改变;b取某一个q=q0,a获得的总效用不为自己p的取值而改变,此时我们说(p0,1-p0)和(q0,1-q0)是一对混合策略下的纳什均衡。

混合策略纳什均衡:在n个参与人的博弈G={S1,...Sn;u1,...un}中,混合策略组合构成一个纳什均衡,如果对于所有的i=1,2...,n下式成立:也就是说,如果一个策略组合使任何一个参与人的策略都是相对于其他参与人的策略的最佳策略,这个策略就构成一个纳什均衡,不管这个策略是混合策略还是纯策略。混合策略纳什均衡是面对其他博弈者选择的不确定性的一个理性对策,其主要特征是作为混合策略一部分的每一个纯策略有相同的期望值,否则,一个博弈者会选择那个期望值最高的策略而排除所有其他策略,这意味着原初的状态不是一个均衡。

严格占优策略均衡、重复剔除的占优策略均衡、纯策略纳什均衡和混合策略纳什均衡。一般将上述四种均衡统称为纳什均衡。在博弈G={S1,S2Sn;U1,U2Un}中第i个博弈方策略空间为Si={Si1Sik}则博弈方以概率分布Pi=(PiPik)随机在k个可选策略中选的的策略称为一个混合策略纳什均衡。

在这四种均衡概念中每种均衡依次是前一种均衡的扩展。前一种均衡是后一种均衡的特例。严格占优策略均衡是重复剔除的占优策略均衡的特例;重复剔除的占优策略均衡是纯策略纳什均衡的特例;纯策略纳什均衡是混合策略纳什均衡的特例。

如果将完全信息静态博弈中存在某种均衡的所有博弈定义为一个集合,那么就存在前一种均衡的博弈集合是后一种均衡的博弈集合的子集。

实现

1、最大化收益法:即最大化各个参与人的效用函数。

2、收益相等法:根据前面分析的猜硬币博弈中参与人的策略的思路,每个参与人的混合策略都使其余参与人的任何纯策略的期望收益相等,因此,解混合策略纳什均衡可以令参与人的各个纯策略收益相等,构成方程组求解。

混合策略纳什均衡,什么是纳什均衡理论?

3、混合策略下的纳什均衡

谁能告诉我混合策略下的纳什均衡如何理解?

谢谢了!!

4、设某个纯策略博弈的纳什均衡不存在试问:相应的混合策略博弈的纳什均衡会存在吗?试举一例说明.

【答案】:在同时博弈中,纯策略的纳什均衡可能存在,也可能不存在,但相应的}昆合策略纳什均衡总是存在的。例如表10-9所示,在下面的二人同时博弈中,根据条件策略下划线法可知由于没有一个单元格中两个数字之下均有下划线,故纯策略的纳什均衡不存在,但是相应的混合策略纳什均衡却是存在的。

首先分别计算甲厂商和乙厂商的混合策略: E甲=4P1ql+9P1(1-ql)+7(1-P1)ql+2(1-P1)(1-q1) =p1(7 -1Oql) +5q1 +2 E乙= 6P1ql+P1(1- q1)+3(1-p1)ql+8(1- P1)(1- q1) =5q1(2p1 -1) -7P1+8 其次分别计算甲厂商和乙厂商的条件混合策略:

最后,混合策略纳什均衡参见图10-1中点e,此时混合策略纳什均衡可以表示为: ((P1,p2)(q1,q2))=((0.5,0.5)(0.7,0.3)) 但不存在纯策略博弈的纳什均衡。

微信号咨询

请添加微信号咨询:19071507959

在线报名

郑重声明:本文内容、数据、图表等来源于网络引用或其他公开资料,版权归属原作者、原发表出处。若版权所有方对本文的引用持有异议,请联系留学指南网,本方将及时处理。本文的引用仅供读者交流学习使用,不涉及商业目的。本文内容仅代表作者观点,网站不对内容的准确性、可靠性或完整性提供明示或暗示的保证。读者阅读本文后做出的决定或行为,是基于自主意愿和独立判断做出的,请读者明确相关结果。如需转载本方拥有版权的文章,请联系留学指南网www.liuxue678.com注明“转载原因”。未经允许私自转载将保留追究其法律责任的权利。

上一篇:混合物的分离和提纯,列举生活中混合物分离和提纯的例子?

下一篇:混合芳烃,混合芳烃是做什么的

相关推荐

关注我们

    留学指南网
返回顶部