e上海公关公司

  1. 主页 > 公关传播

纳什平衡:混合策略平衡点

作者:admin 日期:2022-10-18 09:50:13 点击数:

纳什平衡:混合策略平衡点

我们所说的纯策略(纯策略是指参与者在其策略空间中选择的唯一确定的策略)是否存在纳什平衡点?答案是否定的。除了上述多次熟悉的纯战略平衡点外,一些游戏没有确定的唯一策略,但会有一个混合策略(混合策略是指参与者采取的概率分布,而不是确定的唯一策略)。以警察和小偷的博弈为例,我们将解释混合策略的平衡点。一个小镇只有一名巡逻警察,他独自负责全镇的治安秩序。假设小镇主要分为A、B两区,A区内有一家建设银行,B区内有一家金银首饰店。假设这个小镇上有个小偷,就要偷这个镇。警察一次只能在一个地区巡逻,因为没有分手术;对于小偷来说,一次只能去一个地方偷东西。假设A区建设银行需要保护的财产为2万元,B区珠宝店的财产价值为1万元。如果警察在A区巡逻,小偷碰巧选择去那里,他们会当场被警察抓住,该区建设银行的2万元财产不会损失;如果警察在A区巡逻,小偷选择去B区,因为没有警察的保护,小偷成功盗窃,B区珠宝店1万元财产将分文不剩,落入小偷口袋。在这种情况下,警察如何巡逻才能达到最佳效果?如果按照之前的想法——只能选择一个确定的策略,很明显警察在A区巡逻,可以保留该区建设银行2万元的财产不被盗。小偷去B区,偷窃一定会成功,B区珠宝店1万元财产归小偷所有。也就是说,警察的收入是2万元,小偷的收入是1万元。但这是警察的最佳策略吗?有没有更好的策略可以改进?如果警察在A区或B区巡逻,小偷只是选择去A区或B区,那么小偷就不能实施盗窃。此时,警方的收益为3(保留A区建设银行和B区珠宝店共3万元),小偷的收益为0(无收入),并记录(300)。如果警察在A区巡逻,小偷去B区盗窃,此时警察的收益为2(保留A区建设银行2万元财产),小偷的收益为1(B区珠宝店1万元财产成功盗窃),记录(2、1)。如果警察在B区巡逻,小偷去A区盗窃,此时警察的收益为1(保留B区珠宝店1万元财产),小偷的收益为2(成功盗窃A区建设银行2万元财产),记录(1、2)。警察和小偷之间的支付可以写成以下支付矩阵:通过以上分析,我们可以得出这个游戏没有纯战略纳什平衡点,而是有混合战略平衡点。在混合战略平衡点下,双方的战略选择是其最佳战略选择。此时,警察的最佳选择之一是,警察决定去A区巡逻或B区巡逻。由于A区建设银行的财产价值是B区珠宝店的两倍,用两个签名(如1、2)代表A区巡逻,一个签名(如3)代表B区巡逻。抽1号、2号签,去A区巡逻;抽3号签,去B区巡逻。这样,警察就有2/3的机会去A区巡逻,1/3的机会去B区巡逻,这与巡逻地的财产价值成正比。小偷的最佳选择是以同样的抽签方式决定是去A区还是B区,但与警方相反,小偷抽到1号和2号去B区,抽到3号去A区。然后,小偷有三分之一的机会去A区,三分之二的机会去B区。警察和小偷采取的策略是混合策略。根据上述混合策略,警方的总预期收入为7/3万元,与只有巡逻A区才能获得2万元万元的收入明显改善。原因如下:警察在A区巡逻时,小偷有1/3的机会在A区偷窃,2/3的机会在B区偷窃。此时,警察在A区巡逻的预期收入为7/3(1/3)×3 2/3×2=7/3)万元。警察在B区巡逻时,小偷也有1/3的机会在A区偷窃,2/3的机会在B区偷窃。此时,警察在B区巡逻的预期收入为7/3(1/3×1 2/3×3=7/3)万元。警察的总预期收入为7/3(2/3×7/3 1/3×7/3=7/3)万元。同样,我们也可以得出结论,小偷采取混合策略的总预期收入是2/3万元,这比只偷B区的策略(前提是警察只巡逻A区)。当游戏一方的收入失去另一方时,对于游戏双方的任何一方来说,只有混合策略是平衡的,而不是纯粹的策略。


随便看看