博弈论中的十个经典模型

.:. 草榴社區 » 技術討論區 » 博弈论中的十个经典模型
	回帖發布主題

本頁主題: 博弈论中的十个经典模型	字體大小寬屏顯示只看樓主最新點評熱門評論時間順序

NoRaAwn

級別：禁止發言 ( 8 )
發帖：1335
威望：841 點
金錢：1554 USD
貢獻：75562 點
註冊：2024-01-20

資料短信推薦編輯

博弈论十大经典模型

1、囚徒困境

这是博弈论中最经典的案例，非常耐人寻味，说的是两个囚犯的故事：

两个囚徒一起做坏事，结果被警察发现抓了起来，分别关在两个独立的不能互通信息的牢房里进行审讯。

在这种情形下，两个囚犯都可以做出自己的选择：供出他的同伙(即与警察合作，从而背叛他的同伙)，或者保持沉默(也就是与他的同伙合作，而不是与警察合作)。

两个囚犯都知道，如果他俩都能保持沉默的话，就都会被释放，因为只要他们拒不承认，警方无法给他们定罪。

但警方也明白这一点，所以就给了两个囚犯一点儿刺激：

如果他们中的一个人背叛，即告发他的同伙，那么他就可以被无罪释放，同时还可以得到一笔奖金。而他的同伙就会被按照最重的罪来判决，并且为了加重惩罚，还要对他施以罚款，作为对告发者的奖赏。

当然，如果这两个囚犯互相背叛的话，两个人都会被按照最重的罪来判决，谁也不会得到奖赏。

那么，这两个囚犯该怎么办呢？是选择互相合作还是互相背叛？

从表面上看，他们应该互相合作，保持沉默，因为这样他们俩都能得到最好的结果——自由。但他们不得不仔细考虑对方可能采取什么选择。

A犯不是个傻子，他马上意识到，他根本无法相信他的同伙不会向警方提供对他不利的证据，然后带着一笔丰厚的奖赏出狱而去，让他独自坐牢。这种想法的诱惑力实在太大了。

但他也意识到，他的同伙也不是傻子，也会这样来设想他。

所以，A犯的结论是，唯一理性的选择就是背叛同伙，把一切都告诉警方。因为如果他的同伙笨得只会保持沉默，那么他就会是那个带奖出狱的幸运者了。而如果他的同伙也根据这个逻辑向警方交代了，那么，A犯反正也得服刑，起码他不必在这之上再被罚款。

所以其结果就是，这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应：坐牢。

在很多商业或个人的合作过程中，我们不可避免地会遇到类似的两难境地，这个时候需要相互之间有足够的了解与信任，没有起码的信任做基础，切不可贸然合作。

在对对方有了足够的信任之后，诚意也是必不可少的，如果没有诚意或者太过贪婪，就可能闹到双方都没有好处的糟糕情况，造成双输的结果。

2、枪手博弈

有三个枪手，第一个枪手A的命中率是80%， B是60%，C是40%。

他们同时举枪瞄准、同时射击另两个人中的一个，要尽可能消灭对手，每个人一次机会，一颗子弹，目标是努力使自己活下来。

谁活下来的可能性最大？

如果你认为枪法最准的A胜出，那么你就错了。

我们来看，如果你是A，你毫无疑问的会瞄准对你威胁最大的B，而B也会瞄准对他威胁最大的A，而C则也可能瞄准A，那么三个人存活的概率都是多少呢？

A = 100% - 60% - （1-60%）* 40% = 24%
B = 100% - 80% = 20% (因为命中率为80%的A在瞄准他)
C = 100% （因为没有人瞄准他）
原来，枪法最不准的C竟然活了下来。

那么，换一种玩法呢？

如果三个人轮流开枪，谁会生存下来？

如果A先开枪的话，A还是会先打B，如果B被打死了，则下一个开枪的就是C，那么此时A生存的概率为60%，而C依然是100%（他开过枪后A没有子弹了，游戏结束）；

如果打不死B，则下一轮在B开枪的时候一定会全力回击，A的生存率为40%，不管是否打死A，第三轮AB的命运都掌握在C的手里了。

那么，如果游戏规则规定必须由C先开枪，如果你是C怎么才能让自己活下来呢？

答案是胡乱开一枪，只要不针对AB任何一人即可。

当C开枪完毕，AB还是会陷入互相攻击的困境。

插播1：警察与小偷——令人沮丧的博弈结局

警察和小偷各只有一个机会去巡查或者偷盗A地或B地。A地的价值大于B地，那么警察应该为了保护价值大的地方，而一直保护A地吗？

博弈论认为当然不是，警察的合理策略应当是有倾向于A以一定概率的随机巡查。

这个概率就是：p=A地价值/AB地总价值。

这种情况下才能使小偷最大得手几率降至最低。

但是很不幸的是，此时的小偷谋求的是，最小得手几率的最大化。也就是说，警察的最优策略将把小偷的最差策略改良！

这个便是冯·诺伊曼提出的“最小最大定律”。

我们必须再一次感谢这个不完美的世界，因为现实之中，类似的现象，对于一方仍然可以设法找到对手致命的规律性行动（当然必须考虑到对方是不是一个更加老练的猎手，故意放出的诱饵）。

而保持自己行动的无序性，则有可能成为欺骗策略的武器，这倒似张三丰所言道的：无招胜有招。

3、智猪博弈

在博弈论（Game Theory）经济学中，“智猪博弈”是一个著名的纳什均衡的例子：

假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽，另一头安装着控制猪食供应的按钮，按一下按钮会有10个单位的猪食进槽，但是谁按按钮就会首先付出2个单位的成本，若大猪先到槽边，大小猪吃到食物的收益比是9∶1；同时到槽边，收益比是7∶3；小猪先到槽边，收益比是6∶4。

那么，在两头猪都有智慧的前提下，最终结果是小猪选择等待。

实际上小猪选择等待，让大猪去按控制按钮，而自己选择“坐船”(或称为搭便车)的原因很简单：

在大猪选择行动的前提下，小猪也行动的话，小猪可得到1个单位的纯收益(吃到3个单位食品的同时也耗费2个单位的成本，以下纯收益计算相同)；而小猪等待的话，则可以获得4个单位的纯收益，等待优于行动；

在大猪选择等待的前提下，小猪如果行动的话，小猪的收入将不抵成本，纯收益为-1单位；如果小猪也选择等待的话，那么小猪的收益为零，成本也为零。总之，等待还是要优于行动。

在小企业经营中，学会如何“搭便车”是一个精明的职业经理人最为基本的素质。

在某些时候，如果能够注意等待，让其他大的企业首先开发市场，是一种明智的选择，这时候有所不为才能有所为！高明的管理者善于利用各种有利的条件来为自己服务。

“搭便车”实际上是提供给职业经理人面对每一项花费的另一种选择，对它的留意和研究可以给企业节省很多不必要的费用，从而使企业的管理和发展走上一个新的台阶。

这种现象在经济生活中十分常见，却很少为小企业的经理人所熟识。

4、斗鸡博弈

两只斗鸡在决斗的时候，无论选择进或退都是一个难题，因为纳什均衡已经给出了一胜一败的最优策略。

在很多较量下，死拼将是得不偿失的，因为很可能给第三者机会。

因此，两个已经在战场的强势力很可能自觉的遵循纳什均衡，当一方攻击时，另一方暂退。虽然可能某方暂时受损，但较之于两败俱伤是好得多的。

不过，要维持这一状况，必须保证下一次先期受损的一方发动攻势的时候，另一方同样的后退。于是这样的攻击性行为开始变得“仪式化”，没有人真正流血。

这只不过是两个巨头玩弄的游戏，目的是警告后来者，想进来，那么也得陪我们一起玩，可是你玩的起么？

这正是百事的广告，即使暗含挑衅也最多只到“敢为中国红”这样的地步的原因。

插播2：协和谬误

欧洲征服在大量投资协和飞机后，终于不能自拔。即使前景黯淡，也撑着面子投下去，非要走头无路才放弃，而这时投入的成本已经全打水漂了。

如果，发现不能继续的时候，就果敢放手，损失会小得多。可是他们会、能这么做么？壮士断腕，是何等的壮烈，却也是何等的艰难！

沉没成本很可能会延续人们无畏的坚持，已经沉没的本该放弃，可惜大部分有赌徒式的心理，相信阿基米德的杠杆终将启动。可惜他们在爬到足够撬动杠杆的支点之前，已经窒息了。

协和谬误，倒是给了人们半途而废的理由，会不会有人担心它的滥觞会左右一些本该坚持的目标？

的确有这个可能，但是应该相信人们足够理智，完全可以比较沉没成本、机会成本与未来收益的关系。看清了的，必定会坦然地走出协和谬误。

5、蜈蚣博弈

一场颠前倒后的博弈。

蜈蚣博弈的机理是以最终的结果倒退至开始。这是一个睿智的策略，因果相报，把握好因缘，自有好结果。

它的另一个好处，就是使得未来的计划明晰化，使你不再徘徊。只可惜很多时候，碌碌无为的我们并没有看透迷局的眼睛，我们黑色的眼睛只习惯于黑夜。

蜈蚣博弈也有一个致命的悖论，仍旧是个人利益和集体利益的冲突，因为最后一次的背叛收益，要始终优于合作。

可悲的是，这一次背叛将由于人性的理智，穿越时光隧道，回到原始的地点：人们将从开始就拒绝合作。

还是感谢这个不完美的世界吧，事实上人们很少这样做。当然合作到最后的也很少，这意味着，倒推法只在中间阶段突然发生了作用，只不过谁也不能预测，中间一步在哪里。

在那里，我们只有冀望信任、道德、良知等等。

6、分蛋糕博弈

两个小孩怎么分蛋糕？

经典的故事，经典的解答：一个分，一个选。

现实多如此，权利的合理分配，将有效促进公平与效率；经营权与所有权的分置，的确使得经济更加活力。

不过分蛋糕的进阶模型却强调了讨价还价的策略，分蛋糕不是一次性的，而是多回合的，而且出现成本：蛋糕在融化。

时间成本的加入，将使得分配变得复杂化。双方如果不能及时达成交易，不仅集体的收益将减量，而且个体的收益也将减少。

在此情况下，利用时间成本以及威胁、承诺将对其中一方极其有利。

顾客可能迫于情势，必须尽快结束谈判，这时卖方却不慌不忙，故意拖延，顾客一方将不得不在价格上作出妥协。

顾客一方当然也有策略，它的策略就是货比三家，要求承诺或威胁，这个前提是买方市场的存在。顾客还应当保护自己讨价还价的能力，这就是顾客有权投诉商家。

7、鹰鸽博弈

这个博弈很多人等同于斗鸡博弈。

不过，斗鸡是两个兼具侵略性的个体，鹰鸽却是两个不同群体的博弈，一个和平，一个侵略。

在只有鸽子一个苞谷场里，突然加入的鹰将大大获益，并吸引同伴加入。

但是，结果并不是鹰将鸽逐出苞谷场，而是一定比例共存，因为鹰群增加一只鹰的边际收益趋零时（鹰群发生内斗），均衡将到来。

由此产生了ESS进化上的稳定策略，也就是说一旦均衡形成，偏离的运动会受到自然选择的打击。也就是鹰群饱满后，再试图加入的鹰将会被鹰群排挤。

进化上的稳定均衡最大的好处，莫过于保持稳定。但问题在于形成强势的路径依赖，也就是胜出的不一定是最好的。

因为最好的会被当作出头鸟干掉，这是个体的失败，集团的胜利以及集体的止步不前。

8、脏脸博弈

恍然大悟的博弈。

三个人在屋子里，不许说话。美女进来说：你们当中至少一个人的脸是脏的。三人环看，没有反应。

美女又说：你们知道吗？三人再看，顿悟，脸都红了。为什么？

因为美女后一句废话点破天机，三个人都知道脏脸的存在，而且推测知道对方也知道了脏脸的存在（因为另两人脸没红，说明他们看到脏脸了），而且知道对方知道自己已经想到上一步……

循环开始，知识开始共同化，真相大白：三个人都是脏脸，所有人都脸红了。

这就是共同知识的作用，它的作用显得有点可怕的强大。几乎是一招无影腿，杀人不见血。

在台面上的博弈之前，私下的算计已经置对手于死地。不过，很可能对方也预料到这一点，早也想到这一点，同时杀来。终于，形成双死局面。

当然，现实虽然存在类似现象，不过共同知识更大的作用，在于减少交易成本。因为某些规则人尽皆知，双方只要各自依之行事就可以了。

1）信息均衡：
很显然，信息的作用在博弈之中非常重要。将博弈论还原到现实，人们不再完全理性，信息存在不对称，博弈就需要在抢占信息高地上作出努力。

信息不对称，是一个很大的障碍。信息的不对称会造成“逆向选择”和“道德风险”，前者事前，后者事后。信息不对称短期内对某一方会有利，但最终会破坏整个市场。于是有两个解决策略。

2）信息传递：
传达你的正面的信息的策略，也就是说吸引顾客走到你的柜台面前。它的要点是保持有效、减低成本。

3）信息甄别：
诱导对手暴露其私下拥有的真实信息。就是给顾客一个放大镜，保证顾客不会走到其他柜台去。这种策略显然更加有效，不过风险也更大：万一顾客用放大镜看出了了自己的瑕疵怎么办？

插播3：博傻理论

在资本市场中（如股票、期货市场）：人们之所以完全不管某个东西的真实价值而愿意花高价购买，是因为他们预期会有一个更大的傻b，会花更高的价格从他们那儿把它买走。

“博傻理论”所要揭示的就是投机行为背后的动机，投机行为的关键是判断“有没有比自己更大的傻b”，只要自己不是最大的傻b，那么自己就一定是赢家，只是赢多赢少的问题。

如果再没有一个愿意出更高价格的更大傻b来做你的“下家”，那么你就成了最大的傻b。可以这样说，任何一个投机者信奉的无非是“最大的傻b”理论。

何谓博傻？

博傻是指在高价位买进股票，等行情上涨到有利可图时迅速卖出，这种操作策略通常被市场称之为傻瓜赢傻瓜，所以只能在股市处于上升行情中适用。

从理论上讲，博傻也有其合理的一面，博傻策略是高价之上还有高价，低价之下还有低价，其游戏规则就像接力棒，只要不是接最后一棒都有利可图，做多者有利润可赚，做空者减少损失，只有接到最后一棒者倒霉。

在艺术品市场中：预期会有人花更高的价格从你手中买走它。

博弈论中的傻b理论（Theory of Greater Fool）：

你之所以完全不管某件艺术品的真实价值，即使它一文不值，也愿意花高价买下，是因为你预期会有更大的傻b，花更高的价格从你手中买走它。

而投资成功的关键，就在于能否准确判断，究竟有没有比自己更大的傻b出现？

只要你不是最大的傻b，就仅仅是赚多赚少的问题。
如果再也找不到愿意出更高价格的更大傻b从你手中买走这件艺术品，那么，很显然你就是最大的傻b了。

9、以牙还牙

这是一个用于博弈论的重复囚徒困境（Reiterated Prisoner's Dilemma）非常有效的策略。

也就是说，人家怎么对你，你也怎么对他。

说得再准确点，这个策略在开局时选择合作，以后则模仿对手在上一期的行动。

这一策略有两个步骤：

1）第一个回合选择合作
2）下一回合是否选合作，要看上一回对方是否合作。
若对方上一回背叛，此回合我亦背叛；若对方上一回合作，此回合继续合作

以牙还牙策略有四个特点：

1）友善：以牙还牙者开始一定采取合作态度，不会背叛对方；
2）报复性：遭到对方背叛，以牙还牙者一定会还击作出报复；
3）宽恕：当对方停止背叛，以牙还牙者会原谅对方，继续合作；
4）不羡慕对手：以牙还牙者个人永远不会得到最大利益，整个策略以全体的最大利益为依归。

10、手表定律

手表定律是指一个人有一只表时，可以知道现在是几点钟，而当他同时拥有两只表时却无法确定。

两只表并不能告诉一个人更准确的时间，反而会让看表的人失去对准确时间的信心。

你要做的就是选择其中较信赖的一只，尽力校准它，并以此作为你的标准，听从它的指引行事。

记住尼采的话：“兄弟，如果你是幸运的，你只需有一种道德而不要贪多，这样，你过桥更容易些。”

如果每个人都“选择你所爱，爱你所选择”，无论成败都可以心安理得。然而，困扰很多人的是：他们被“两只表”弄得无所适从、心身交瘁，不知自己该信仰哪一个；

还有人在环境、他人的压力下，违心选择了自己并不喜欢的道路，为此而郁郁终生，即使取得了受人瞩目的成就，也体会不到成功的快乐。

手表定理在企业经营管理方面，能给我们一种非常直观的启发，就是对同一个人或同一个组织的管理，不能同时采用两种不同的方法，不能同时设置两个不同的目标。

甚至，每一个人不能由两个人来同时指挥，否则将使这个企业或这个人无所适从。

手表定理所指的另一层含义，在于每个人都不能同时挑选两种不同的价值观，否则，你的行为将陷于混乱！

DMCA / ABUSE REPORT | TOP Posted: 02-11 15:57 發表評論

NoRaAwn [樓主]

級別：禁止發言 ( 8 )
發帖：1335
威望：841 點
金錢：1554 USD
貢獻：75562 點
註冊：2024-01-20

赞(1) | 資料短信推薦編輯

引用

引用第2樓真正的马甲於2024-02-11 16:04發表的 :
小学不念这些个

感谢支持

TOP Posted: 02-11 16:15 #1樓引用 | 點評

NoRaAwn [樓主]

級別：禁止發言 ( 8 )
發帖：1335
威望：841 點
金錢：1554 USD
貢獻：75562 點
註冊：2024-01-20

赞(1) | 資料短信推薦編輯

引用

引用第3樓stephenlee於2024-02-11 16:05發表的 :
学习了，不错不错。

感谢支持。

TOP Posted: 02-11 16:50 #2樓引用 | 點評

NoRaAwn [樓主]

級別：禁止發言 ( 8 )
發帖：1335
威望：841 點
金錢：1554 USD
貢獻：75562 點
註冊：2024-01-20

赞(1) | 資料短信推薦編輯

博弈论中的经典模型

TOP Posted: 02-18 18:15 #3樓引用 | 點評

NoRaAwn [樓主]

級別：禁止發言 ( 8 )
發帖：1335
威望：841 點
金錢：1554 USD
貢獻：75562 點
註冊：2024-01-20

赞(1) | 資料短信推薦編輯

引用

引用第78樓emmy於2024-02-15 06:37發表的 :
思钱想厚，坐以待币💰💰

大佬大文采当代文曲星

點評

TOP Posted: 02-22 21:48 #4樓引用 | 點評

NoRaAwn [樓主]

級別：禁止發言 ( 8 )
發帖：1335
威望：841 點
金錢：1554 USD
貢獻：75562 點
註冊：2024-01-20

赞(1) | 資料短信推薦編輯

引用

引用第79樓shenpao於2024-02-15 07:04發表的 :
逻辑学烧脑

学一学受益无穷

TOP Posted: 02-27 17:46 #5樓引用 | 點評

.:. 草榴社區 » 技術討論區