聚上美聚上美

分享生活见闻
领略世界奇闻怪事、体验民间趣事

囚徒困境博弈 囚徒困境博弈中两个囚徒之所以会处于困境

关于囚徒困境博弈✅的问题,下面有几个最新囚徒困境博弈中两个囚徒之所以会处于困境的观点,这里聚上美网站生活见闻小编希望能帮您找到想要的囚徒困境博弈答案,了解更多囚徒困境的相关博弈的相关详细知识。
相关囚徒困境博弈的扩展:
囚徒困境的相关博弈 霍夫施塔特2曾提出,像囚徒困境一类的问题,若以简单博弈的形式来说明,人们会较容易理解。例如他以“封闭袋子交易”的简单博弈来说明此论题:两人面对面互相交换封闭的袋子,共同了解其中一方放钱,另一方放商品。双方可以诚实的依照承诺,把东西放到袋子里交换;又或者交空袋子给对方,选择背叛。在这场博弈中,由于背叛可获得巨大利益,必然有多人选择背叛。这意味着理性的商人不会进行这种交易,因而“封闭袋子交易”将由于逆向选择而失去市场。 “是敌是友?”是一个竞赛表演节目,从2002年到2005年在美国竞赛表演广播网(Game Show Network)放映。这是一个用真人进行的囚徒困境博弈例子,不过情景是人造的。这个竞赛表演有三对人参与竞争。当每对人被淘汰时,他们做一个囚徒困境博弈,决定如何分他们的奖品。如果他们都合作(“朋友”),他们的奖品就被平分。如果一个合作而另一个背叛(“敌人”),背叛者得到所有的奖品,合作者什么都得不到。如果都背叛,那么两人都一无所获。注意,这个支付矩阵与前述标准的支付矩阵不同,因为发生“都背叛”的情形和“我合作而对手背叛”的情形,其损失是一样的。和标准囚徒困境的稳定均衡相比,“都背叛”是不稳固的均衡(weak equilibrium)。如果你知道你的对手将成为“敌人”,这时你的选择无法影响你的奖品。在某种意义上,“是敌是友”拥有一个介于“囚徒困境”和“小鸡”之间的支付模型。这个支付矩阵是:如果参与者都合作,每人得到 +1。如果都背叛,每人得到 0。如果甲合作而乙背叛,甲得到0而乙得到 +2。是敌是友对于想对囚徒困境作现实分析的人将是有用的。注意到,参与者只能进行一次,所以所有涉及重复进行博弈的观点都不适用,“以牙还牙”策略也无法发展出来。在是敌是友中,每个参赛者被允许做一个声明,使另一半友在双方秘密决定合作或背叛之前,确信他的友善。可能“打破制度”的方法将是一个参与者告诉他的对手:“我会选择做敌人。如果你相信我后来会和你分奖品的话,就选择做朋友。否则,如果你选择做敌人,我们都会空手而回。”一个更贪婪的版本将是:“我将选择做敌人。我会给你百分之X,剩下的百分之(100-X)归我。所以,要或不要,要么我们都得到一些,要么我们都一无所获。”(在最后通牒博弈中时。)如今,奸计就是去尽量减少那个百分之X,并保持另一个竞争者仍然选择做朋友。基本上,这个参与者必须知道这个界限,在这里他的对手从看到他一无所获中得到的效用,要超过他从肯定能赢得的金钱中得到的效用,如果他顺利的话。在竞赛中这个方法从未被试验过;可能是因为裁判们不会允许,而且即使允许,不平等厌恶也会由于这个规则的使用而导致较低的期望收益。(最后通牒博弈中尝试了这个方法,结果导致对高而不平等的出价的拒绝——在一些案例中,相当于两周的工资优先于两个参与者一无所获被决绝。)
博弈论-囚徒困境

背叛,也是有价格的-囚徒困境

牢房里的猪队友

一天,警察抓获两名一同作案的嫌疑犯,分别把他们放到两个房间里审讯。两个人都不知道同伴跟警察说了什么。警方的政策是“坦白从宽,抗拒从严”:如果两个人都认罪,各判5年;如果两个人都不认罪,则各判1年,如果只有一个人认罪那么认罪的这个人将被释放,不认罪的那个人要判10年。如果你是其中一名囚徒,你会怎么选择?

以上帝的视角来看,两人都选择不认罪,也就是包庇对方,是一种最优的策略,每个人只要判1年。然而囚徒的内心却是复杂的:对A囚徒来说,要分析两种情况,也就是B囚徒认罪和不认罪的两种可能。第一种情况,B囚徒没认罪。这个时候A囚徒认罪,会被无罪释放;A囚徒不认罪,会被判1年。那相比之下对A囚徒来说,认罪是更优的策略。第二种情况,B囚徒认罪。这时候A囚徒也认罪,会被判5年;A囚徒不认罪,就要被判10年。相比之下,认罪仍然是对A囚徒来说最优的方案。不难发现,无论B囚徒选择认罪或者不认罪,A囚徒的最优策略都是认罪。这样一来,只要两名囚徒足够理性,几乎必然双双选坦白从宽,各判5年。

囚徒困境博弈 囚徒困境博弈中两个囚徒之所以会处于困境(图1)

真是应了那句话:“不怕神一样的对手,就怕猪样的队友”。但你确定,那个“猪队友”不会是你吗?

损人往往并不能利己

囚徒困境最早是由普林斯顿大学的数学家阿尔化特·塔克在1950年提出的,它告诉我们,每当个人利益与集体利益发生冲突的时候,足够理性的人会优先追求个人利益,正所谓“人不为己,天诛地灭”。但是,当大家都从利己角度出发的时候结果却往往是损人不利己。比如故事原型里的两个囚徒,最后各判5年,谁也没占到便宜。

囚徒困境博弈 囚徒困境博弈中两个囚徒之所以会处于困境(图2)

摆脱囚徒困境的方法

1.增加背叛成本

以某种方式明确下来,一旦发生背叛行为,将要遭受到怎样的惩罚,我们假设两名囚徒都知道对方的家在哪,能威胁的对方家人的安危,那他们直接背叛的可能性,是不是就小了很多呢。所以说在很多的历史故事里,我们经常看到双方为了结盟,要么互相送个儿子作为抵押,要么请求对方把女儿嫁过来,比如历史上很有名的文成公主与松赞干布的联姻,本质上都是为了增加对方背叛的成本。换句话说,背叛也是有价格的。

2.引入第三方

引进一个外在的监督者,减少博弈双方背叛的机会也是一种常见的商业策略。比如电子商务刚刚兴起的时候,就比如03年阿里巴巴的淘宝起来的时候,04年京东起来的时候,那时候卖方不愿意先发货,卖家担心万一我货到了不给钱呢,买家呢也不愿意先付款,万一我给了钱人跑了呢,所有那时候第三方支付,支付宝出现了。消费者的钱先存放在支付宝里,等买家收到货支付宝再将钱支付给商家。那这时候第三方作为一种信用中介,消除了买卖双方背叛的可能性,从此电商开始了暴发式的增长。

3.重复博弈

大家想一想,如果同一个博弈可以重复进行多次,比如这两个囚徒被抓了100次,他们还敢轻易的选择背叛对方吗?在这样的博弈中,任何一次背叛都会招致对方下一次的报复,如果这一次我出卖的你,下一次你就会加倍的出卖我,这就使得我背叛你,弊大于利,也因为此,大家都倾向于彼此合作。咱们举个例子,在你家门口的小饭店是又便宜又好吃,但是一到旅游景点那饭店不但难吃到暴还贵的不要不要的。这是为什么呢,因为家门口的小饭店坑你一次你就不会再来下一次了,旅游景点就不一样了,那是一锤子买卖,他就是再好吃你也大概率不会来第二次了,他不宰你宰谁呀。

我们总结一下,一句话理解囚徒困境:背叛,也是有价格的,而聪明人知道怎么让这个价格大到对方不会背叛。那想要摆脱囚徒困境呢,可以第一,增加背叛成本;第二,引入第三方;第三,重复博弈。

今天囚徒困境博弈的内容先分享到这里了,读完本文后,是否找到相关囚徒困境博弈中两个囚徒之所以会处于困境的答案,想了解更多,请关注www.yfnsxy.cn聚上美世界奇闻怪事网站。

【版权声明】:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请联系首页【QQ秒回】 举报,一经查实,本站将立刻删除。 转载请说明来源于"聚上美",本文地址:https://yfnsxy.cn/shjw/19390.html

未经允许不得转载:聚上美 » 囚徒困境博弈 囚徒困境博弈中两个囚徒之所以会处于困境