为什么纳什均衡不一定是帕累托最优均衡

释老毛: 纳什离世,这是他一生最重要的发现【转载】
转@唐朝 老唐说不懂博弈论,张五常也不看好,特转载张维迎教授的帖子,说的比较清楚。张五常走的是实证分析路线,博弈论走的... - 雪球&来自纳什离世,这是他一生最重要的发现【转载】转 老唐说不懂博弈论,张五常也不看好,特转载张维迎教授的帖子,说的比较清楚。张五常走的是实证分析路线,博弈论走的是纯粹数学推理路线,其实博弈论在现代竞争、谈判、立法等领域得到了广泛应用纳什离世,这是他一生最重要的发现【转载】 张维迎美国时间23日,数学家约翰·纳什与妻子阿莉西亚在美国新泽西不幸遭遇车祸身亡。我们知道他是电影《美丽心灵》中的原型,知道他身患精神疾病还拿下了诺比尔奖的传奇。但是他最重要的贡献“纳什均衡”,你了解吗?“对纳什最好的纪念,就是理解纳什均衡。”——张维迎11994年,约翰o纳什获得诺贝尔经济学奖。小学时期,纳什的学习成绩并不好。比如在数学上,纳什非常规的解题方法就备受老师批评,而后来的事实却证明,这种另辟蹊径恰恰是纳什数学才华的体现。1945年6月,纳什进入卡耐基梅隆大学学习,后进入普林斯顿大学攻读博士学位。1950年,22岁的纳什以非合作博弈(Non-cooperative Games)为题的27页博士论文毕业。在这篇论文中,纳什提出了博弈中的一个重要概念——“纳什均衡”。 这一概念影响深远,成为博弈论中最为核心的名词,极大地推动了博弈论的发展及其在社会科学领域中的应用,特别是促进了经济学的发展。著名博弈论学者、诺贝尔经济学奖得主迈尔森(Myerson,1999)认为,发现纳什均衡的意义可以和生命科学中发现DNA的双螺旋结构相媲美。2什么是纳什平衡?纳什均衡是博弈论最重要、最一般化的均衡概念。它是指所有参与人战略的这样一种组合:在这一组合中,给定其他参与人的战略,没有任何人有积极性改变自己的战略。换言之,构成纳什均衡的战略对每个人都是最优的。纳什均衡有一个很重要的特点,即信念和选择之间的一致性。也就是说,基于信念的选择是合理的,同时支持这个选择的信念也是正确的。所以,纳什均衡具有预测的自我实现(self-enforcement)的特征:如果所有人都认为这个结果会出现,这个结果就真的会出现。(在博弈中的所有组合中,只有纳什均衡能满足自我实施的条件)我们可以换一个角度来理解纳什均衡:假如在博弈之前,所有的参与人达成一个协议。我们的问题是:在不存在外部强制执行的情况下,每一个人是否有积极性去自觉遵守这个协议?如果每个人都有积极性遵守这个协议,这个协议就构成一个纳什均衡。也就是说,给定这个协议,别人遵守的情况下,没有人会有积极性选择不同于这个协议的行动,这个协议就是一个纳什均衡。反之,如果有任何人有积极性单方面背离这个协议,这个协议就不是一个纳什均衡。从下面几个例子,可以看出纳什均衡是一个多么有力的分析工具。举个例子【中国股票市场上的寻租行为】20世纪90年代的中国股票市场上,很多企业不断地通过配股来实现寻租。这可以理解为经理人给股东设计的一个囚徒困境博弈。设想某企业现在的价值是100元,发行在外的流通股有100股,因此每股的价格是1元(假定股票价格准确反映了企业的真实价值)。现在假定经理要筹集100元钱,但是投资之后价值只有50元。从股东的利益讲,这100元是不应该筹集的,但经理人出于控制权或个人享受的目的有积极性这样做。如果股东很分散,假设有100个股东每人持1股,对经理缺乏约束力。现在经理人做出一个配股决策,1配4,配股价是每股0.25元。这样,如果配股完成,就筹集到100元的资金。问题是,股东愿意接受配股吗?如果某一股东不接受配股,他原本持有的1股在配股之后价值就由原来的1元变为0.3元(即公司总价值150元——原始价值100元加上新增价值50元,除以配股后总股数500股);如果股东接受配股,他持有的份额变成5股,仍为总股本的百分之一,那么,他的股票价值是150元的百分之一,即1.5元。他多花4×0.25=1元的代价,多得到1.2元(=1.5-0.3)的总价值,显然,所有股东都接受配股是一个纳什均衡。经理人如愿以偿,但股东集体损失50元。对全体股东有害的事情之所以能做成,是因为经理人配股方案的设计使得股东陷入囚徒困境。如果配股方案是1∶1,每股1元,股东就不会接受配股,因为不接受配股最多损失0.25元(配股后每股价变成0.75元),接受配股的损失是0.5元。这个例子也说明,企业的配股价比市场价越低,配股越有可能是经理人的寻租行为,而不是出于股东利益的考虑。即使我们假定经理人是大股东,只要他在控制权上的利益大于股权上的利益,这个结论也不会改变。【我们为什么不得不“自愿”参加社会保险?】当前的社会保险制度在某种意义上说,也是政府设计的一个囚徒困境博弈,假设职工应得工资为每月1万元,政府扣下1 000元作为社会保险金,发给职工9 000元。然后,如果该职工参加社会保险,个人交纳1 000元保险费,政府配比1 000元,合在一起构成个人账户上的保险金,总共就是2 000元。但假设由于社会保险资金管理不善,等到领退休金的时候,政府管理的2 000元已经变成1 500元。显然,如果1万元工资全额发放,职工最好的选择是不参加保险,自己管好自己的钱。但是现在,由于政府扣下了1 000元,某职工若不参加保险,这部分钱就会白白损失;如果参加,自己再交上1 000元,还可以拿回来1 500元,参加保险还是比不参加保险好。这就是政府给老百姓设计出的囚徒困境博弈,它使每个职工都不得不“自愿”参加社会保险。当然在现实中,当政府管理的保险金不够支付时,通常会用印票子或增加税收的办法补充保险金,而不是减少退休金的办法。但出于这个原因而印票子和征税本身,也不过是政府设计的一个囚徒困境博弈。3纳什均衡为什么重要?纳什均衡对我们理解社会制度(包括法律、政策、社会规范等)非常重要。任何制度,只有构成一个纳什均衡,才能得到人们的自觉遵守。纳什均衡不一定是帕累托最优的,但有效的帕累托最优只有通过纳什均衡才能实现。有效的制度设计,就是如何通过纳什均衡实现帕累托最优。纳什均衡概念作为博弈分析最重要的概念,对于我们研究和理解制度和许多经济社会现象非常重要。一个制度即使对所有人都不好,但如果它是一个纳什均衡,就仍然会持续存在。反之,一个制度即使听起来很好,但如果它不是一个纳什均衡,就不可能得到所有人的自觉遵守。特别是,如果我们的社会要从囚徒困境中走出来,就必须有办法使每个人选择合作成为一个纳什均衡。这就是为什么诺贝尔经济学奖得主梅耶森(Myerson,1999)认为,发现纳什均衡的意义可以和生命科学中发现DNA的双螺旋结构相媲美的原因。同时转发到我的首页发布暂无评论 暂无赞助分享到微信扫一扫苹果/安卓/wp
积分 269, 距离下一级还需 181 积分
权限: 自定义头衔, 签名中使用图片
道具: 彩虹炫, 雷达卡, 热点灯, 雷鸣之声, 涂鸦板, 金钱卡, 显身卡, 匿名卡下一级可获得
道具: 抢沙发
购买后可立即获得
权限: 隐身
道具: 金钱卡, 雷鸣之声, 彩虹炫, 雷达卡, 涂鸦板, 热点灯
RT,纳什均衡是帕累托最优么. 比如能用囚徒困境的例子来解释吗?
载入中......
在论坛里我干的事:1. 找大牛 2. 交学友 3. 问问题
纳什均衡并不是整体最好的解
在论坛里我干的事:1. 找大牛 2. 交学友 3. 问问题
&&而帕累托最优的话指的是双方在当干的时候收益比如说收益各自为4双方在合作的时候收益能各自为10
不是的,要是帕累托最优的话,在囚徒困境中两者肯定选择 不坦白了
来打打酱油
显然不是,纳什均衡时最稳定的解,当存在多重纳什均衡时,可以从帕累托最优的角度来找到一个解
不坦白是最优解。但是不是均衡
不是~试着回忆下,囚徒困境中两人达成的是都坦白,即是均衡状态。
帕累托最优的话是两个都没有改进。但是明显均不坦白的话才是最优。
不知道正不正确……
论坛好贴推荐
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
为做大做强论坛,本站接受风险投资商咨询,请联系(010-)
邮箱:service@pinggu.org
合作咨询电话:(010)
广告合作电话:(刘老师)
投诉电话:(010)
不良信息处理电话:(010)
京ICP证090565号
京公网安备号
论坛法律顾问:王进律师往期回顾 &
博弈论原理及其发展
&&&&许安拓&&&&编者的话&&&&日晚,瑞典皇家科学院将本年度诺贝尔经济学奖再次授予博弈论的理论研究和实践运用者罗伊德·沙普利与埃尔文·罗斯,使得这一理论学派第六次折桂诺奖。博弈论为何如此受青睐?在其演变进程中,有何创新和发展?这个被学者称为“研究互动决策”的理论,在现实中是如何运作的?以博弈论的视角去观察现实生活中的经济、政治、社会、军事、外交等现象,会有什么不一样的发现?它可以为决策者提供怎样的应对复杂问题和治理危机的方法?博弈论思想及其研究对于实践中诸多“怎么看”和“怎么办”问题的解决不无启发。&&&&博弈论从合作博弈发展到了非合作博弈,宣告了博弈论经济学应用新时代的开端,它被诸如军事、政治、外交、制度创新等领域广泛接纳。博弈论的实际运用需要很多严格的条件限制,而对于复杂系统而言,其约束条件常常难以满足,再加上人为的主观因素和信息的不对称性,如果机械地照搬模型,在现实中可能会适得其反。&&&&博弈论的原理&&&&博弈论又被称为对策论,它本是现代数学的一个新分支,也是运筹学的一个重要组成部分。按照2005年因对博弈论的贡献而获得诺贝尔经济学奖的Robert&Aumann教授的说法,博弈论就是研究互动决策的理论。&&&&一般而言,博弈论的基本要素有五个:决策人,就是在博弈中率先作出决策的一方,其往往依据自身的感受、经验和表面状态优先采取一种有方向性的行动,如博弈中先下棋或先出牌的一方;对抗者,在博弈对局中行动滞后的那个人,与决策人要作出基本反面的决定,并且他的动作是滞后的、默认的、被动的;局中人,在一场竞赛或博弈中,每一个有决策权的参与者成为一个局中人,只有两个局中人的博弈称为“两人博弈”,而多于两个局中人的博弈则称为“多人博弈”。策略:一局博弈中,每个局中人都有选择实际可行的完整的行动方案,如果在一个博弈中局中人有有限个策略,则称为“有限博弈”,否则称为“无限博弈”;胜负得失,一局博弈结局时的结果称为得失。每个局中人在一局博弈结束时的胜负得失,不仅与该局中人自身所选择的策略有关,而且与全局中人所取定的一组策略有关。&&&&博弈的类型基本分为四种:合作博弈,研究人们达成合作时如何分配合作得到的收益;非合作博弈,研究人们在利益相互影响的局势中如何选择决策使自己的收益最大,即策略选择问题;完全信息或不完全信息博弈,参与者对所有参与者的策略空间及策略组合下的支付有充分了解称为完全信息,反之,则称为不完全信息博弈。静态博弈和动态博弈,研究外在条件不变或变动时博弈得失。&&&&博弈论思想发展及成果&&&&最早的博弈论思想及专著可以追溯到我国古代的《孙子兵法》,它虽然没有用数学的方法量化分析博弈各方的实力对比,但它已经清楚、全面、多视角地阐述了博弈的基本原理、过程以及可能的结果,其典型案例就是春秋时代的“田忌赛马”。直到1928年冯·诺依曼将其系统化、理论化,宣告了博弈论作为一门科学的正式诞生。1944年,冯·诺依曼和奥斯卡·摩根斯特恩共著的《博弈论与经济行为》又将两人博弈推广到多人博弈结构,并将博弈论系统应用到经济领域。他们第一次提出的标准型、扩展型和合作型博弈模型解的概念和分析方法,奠定了这门学科的理论基础。&&&&合作型博弈在20世纪50年代达到了巅峰期。然而,随着时间推移,其局限性也日渐显露出来:主要是因为其理论和近乎纯数学的研究方法过于抽象,大大地限制了博弈论在现实中的应用范围,在相当长的时间里,博弈论只是少数数学家圈内的游戏,大众对博弈论的研究也知之寥寥,其影响力当然就十分有限了。&&&&直到20世纪50年代初约翰·福布斯·纳什利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的基础。纳什的开创性博士论文《n人博弈的均衡点》(1950)、《非合作博弈》(1951),给出了纳什均衡的概念和均衡存在定理。可以说,正是由于“纳什均衡”的出现,才使得博弈论从合作博弈发展到了非合作博弈,并宣告了博弈论经济学应用新时代的开端。&&&&此后,博弈论在塞尔顿、哈桑尼等人的研究和推动下取得了进一步发展。到20世纪70年代,博弈论被纳入到主流经济学的教科书和研究著作之中。目前,博弈论在纳什和沙普利的研究基础上分别向两个不同方向展开:非合作博弈和合作博弈。&&&&非合作博弈强调个体理性,主要研究在信息不对称条件下市场机制如何发挥其效率,纳什均衡就是其中最重要的代表,纳什均衡描绘出博弈中这样的局面:对于每个参与者来说,只要其他人不改变策略,他就无法改善自己的状况。纳什证明了在每个参与者都只有有限项策略选择、并允许混合策略的前提下,纳什均衡一定存在。“纳什均衡”从本质上挑战了传统经济学的根基,他对亚当·斯密的“看不见的手”的原理提出了质疑:即按照斯密的理论,在市场经济中,每一经济人只要从利己的目的出发,最终就可以在全社会达到利他的效果。但是从“纳什均衡”中却引出了“看不见的手”原理的一个悖论:即纳什均衡不一定是帕累托最优,从利己目的出发,结果是损人不利己,既不利己也不利人。这一发现使得纳什均衡理论成为奠定现代主流博弈理论和经济理论的根本基础,正如克瑞普斯在《博弈论和经济建模》(1990)一书的引言中所说:“在过去的一二十年内,经济学在方法论以及语言、概念等方面,经历了一场温和的革命,非合作博弈理论已经成为范式的中心……”这种非合作博弈所得出的数学解即为“纳什均衡”,它主要解决了博弈各方如何合作才能“互不吃亏”的问题,但难以解决如何才能达到彼此共赢的局面。&&&&合作博弈是在强调集体精神和团体理性的基础上,通过合作、联盟或妥协的方法,使得博弈双方的利益都有所增加,或者至少是一方的利益增加,而另一方的利益不受损害,因而整体利益有所增加。妥协(联盟、合作)之所以能够增进妥协双方以及整体利益的关键就在于合作博弈能够产生一种合作剩余。这种剩余就是从这种妥协或联盟关系和方式中产生出来的,且以此为限。至于合作剩余在博弈各方之间如何分配,则取决于博弈各方的力量对比和技巧运用。因此,妥协必须经过博弈各方的讨价还价,达成共识,进行合作。然而妥协博弈后的双方利益又将如何获得?或者说,如何在双方继续获益或至少一方不受损失的条件下延续这种联盟或妥协呢?长期以来,经济学家对求解这种多重理性常常陷入困惑之中并敬而远之。而沙普利的研究成果使得合作博弈在理论和现实运用上取得了重大突破。正是基于此,它与零和博弈相比是一种正和博弈,合作剩余的分配既是妥协的结果,又是达成妥协的条件。这种思想在解决当今国际、国内现实中存在的许多政治、经济、社会矛盾上都有着极强的理论指导意义。&&&&1952年,沙普利在解决诸多理性人的博弈决策中引入了一个“核”的概念,并将其发展为合作博弈的一般利益分配集合一种所有成员均无法提升自身效用的稳定联盟状态。由于“核”这个概念不能给出联盟内成员效用分配的唯一预测,翌年,沙普利进一步在合作博弈框架中加入了一些着眼于“公平”分配合作利益的公理。沙普利首先对“公平”、“合理”等概念给予了严格的公理化描述,然后寻求是否有满足人们想要的那些公理的解。当然,如果对一个解的性质或公理要求太多,则这样的解可能不存在;另一方面,如果这些性质或公理要求得少,则又可能有许多解,即解存在但不唯一。&&&&他证明在这些公理的约束下,存在唯一的效用分配方案,这就是沙普利值。沙普利值是根据各人给联盟带来的增值来分配,在直观上是所有边际贡献的平均值。沙普利值计算方法简单,而且能得到合作博弈的唯一解,使用较为广泛。到目前为止这个解仍然是合作博弈领域内最重要的结果之一。不仅如此,沙普利的工作具有方法论上的重要意义,他的公理化方法使我们可以研究讨论合作博弈中其他各种各样的解。&&&&沙普利本人正是该技术最好的应用者。他与舒比克发表了一篇著名的论文《委员会制度下的权利分配评价方法》,后来称之为沙普利—舒比克权力指数。当时他们将沙普利值引入投票机制,评价了委员会制度的权力分配体系。目前,这一指数已广泛地应用于公司金融领域,反映了股权对公司决策的影响力,能够客观地度量某股东或某些股东对股份制公司的控制力。&&&&传统经济学中,通过价格调整可以实现供需平衡。然而,在一些特殊市场中,价格不能用作配置资源的手段,资源只能以分配或配给方式加以配置。这就为合作博弈提供了广阔的空间,当今世界由于在解决各类资源共享问题上冲突不断,合作博弈以其独特的配置方法解决了一系列资源共享中的匹配难题而在经济学中的地位与日俱增。尤其是在解决具体微观问题的配置方法上旨在寻找稳定解,即保证每一个配对都是稳定的,在匹配市场上没有剩下彼此愿意与对方组对,但却没有被市场允许的一对人,同时,已组对的人对自己的队友应该是满意的。这不仅形成了基于经典博弈的研究范式体系,扩展了传统经济学研究问题的范围,改变了传统经济学的体系和结构,冲击了传统主流经济学的许多观点,还拓展和加强了经济学与其他社会科学、自然科学的联系。尤其在现实运用中更是随处可见。&&&&博弈论的现实运用&&&&博弈论自1994年授予纳什均衡理论以来,至今已有6次获诺贝尔经济学奖。它深刻地改变了经济学项下各子学课的内容和研究方法,同时在经济学领域外的政治学(国内以及国际)、军事战略学、进化生物学以及计算机科学等领域都已成为重要的研究和分析工具。不仅如此,它还与会计学、统计学、社会心理学以及诸如认识论、伦理学等哲学分支有着重要的联系,尤其在局部简单的资源配置实践上常常能达到甚佳的效果。例如,2012年的诺贝尔经济学得主之一—罗斯的“全国住院医生配对程序”就是一个将沙普利的博弈理论应用于医学院毕业生分配到医院的住院实习医师系统的较好的现实案例。他确定了这个系统可以形成“稳定匹配”;他还帮助重新设计了现存的器官捐赠者和接受者之间进行配对的一些制度,极大地优化了资源配置,尽可能拯救了更多的生命。这些案例对当今我国解决一些现实的局部矛盾如初高中学生择校难、制度腐败、工资协商等问题都有积极的理论指导和借鉴意义。&&&&十八大报告中,我党提出的“五位一体”的治国理念涵盖了生态文明建设。我们就可以运用博弈论的基本原理来治理生态污染:当前各地环境污染严重,政府监管乏力,企业为了追求利益的最大化,宁愿以牺牲环境为代价,也不愿主动增加环保设备投资。如果按照传统的经济学理论:所有企业都从利己的目的出发,采取不顾环境的策略,就可进入“纳什均衡”状态。如果一个企业从利他的目的出发,投资治理污染,而其他企业仍然不顾环境污染,那么这个企业的生产成本就会增加,价格就要提高,它的产品就没有竞争力,甚至企业还要破产。这就是一个“看不见的手的有效的完全竞争机制”失败的例证。直到现在,这种遍地污染的局面仍然未见改善。因此,我们可以应用博弈论的基本原理,强化政府监管,加大污染管制,大幅提高污染企业的交易成本,唯此,这些企业才会采取低污染的策略组合。认识到合作博弈的重要性,积极采取治理污染的措施,可获得与高污染同样的利润,但环境将会变得更好。&&&&我们也可以用博弈论来理解当前国际关系中的一些争端。日,日本政府不顾中方多次反对,与所谓的土地所有者签订“购岛”合同,企图用偷梁换柱的方式窃取钓鱼岛,随即钓鱼岛争端恶化成了危机,博弈各方都相继登场。从表面上看,钓鱼岛争端可以简单地视为中日之间的“两人博弈”,但将其置于整个国际大背景下,即呈现出一种有限、动态的非合作博弈,其复杂程度绝非可以用一个模型或是某种算法所能解释清楚的。说它是有限博弈,是指其局中人的策略有限,即无外乎战、和、抗三种状态;说其动态,因为各方的国内国际政治、经济、社会生态都处在不断变动之中,而这些变量的不同走势都会直接影响到岛争的结局;说它非合作,是指各方在博弈中都希望获取自身收益的最大,其策略选择呈现出非合作性;最后是复杂的“多人博弈”,从最少的中日双方,到中日美台四方,再到更大范围内的俄罗斯、欧盟、南亚、中东等诸多的直接或间接利益相关者,他们也都会借此中日岛争涉入局中以博得自身利益的最大化或至少分得由此产生的“汤羹”。在如此复杂多变而且信息又不对称的博弈中只能从博弈的基本理论和思想出发,精算推理出一个大致的结果,绝不可能用静态的模型或是数学的方法得出一个多赢的局面。&&&&日本政府鉴于多次在钓鱼岛问题博弈上将中方以“和为贵”及“睦邻富邻安邻”的和平外交政策为软弱可欺,首先用“购岛”的方法选择了“单方对抗”,它希望通过“试应手”(围棋博弈术语)的方法让中方选择忍辱负重式地“单方合作”,那日本单方收益将大胜,中方大负;没想到日方误判形势,低估了中方捍卫国家领土的决心,随即中方也被迫选择“对抗”的方式以抵减“受骗支付”的损失,中方的选择要让日方意识到在反复博弈中只有选择“合作博弈”的方式才能最终让双方脱离困境。因此,日方必须清醒地认识到,只有从大局出发,承认争议、回到谈判合作的道路上来才是双赢的博弈结局。它也生动地说明了:在非零和博弈中,帕累托最优和纳什均衡是相冲突的。&&&&但是我们也应该看到,博弈论的实际运用需要很多严格的条件限制,而对于复杂系统而言,其约束条件常常难以满足,再加上人为的主观因素和信息的不对称性,如果机械地照搬模型,在现实中可能会适得其反。虽然我们不能将复杂现实情况的博弈完全基于数理模型之上,但其对微观事物的决策动机、博弈参与者变量之间的相互作用及其演变过程的推理分析都有极强的现实运用价值,在这方面与传统经济学研究的方法论、思维范式以及决策统筹的现实运用相比,突破了零和博弈的局限,尤其是在双赢或多赢博弈结果的达成与分析上,更能迎合当今国际、国内经济和社会发展以及战略对抗的潮流。&&&&(作者为财政部财政科学研究所研究员、研究生部教授)
<INPUT type=checkbox value=0 name=titlecheckbox sourceid="SourcePh" style="display:none">[转载]纳什均衡和帕累托最优
纳什均衡(Nash
equilibrium)
纳什均衡名称来源及简介:
  纳什均衡,Nash equilibrium
,又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。约翰·纳什1948年作为年轻数学博士生进入普林斯顿大学。其研究成果见于题为《非合作博弈》(1950)的博士论文。该博士论文导致了《n人博弈中的均衡点》(1950)和题为《非合作博弈》(1951)两篇论文的发表。纳什在上述论文中,介绍了合作博弈与非合作博弈的区别。他对非合作博弈的最重要贡献是阐明了包含任意人数局中人和任意偏好的一种通用解概念,也就是不限于两人零和博弈。该解概念后来被称为纳什均衡。
纳什均衡定义:
  假设有n个局中人参与博弈,给定其他人策略的条件下,每个局中人选择自己的最优策略(个人最优策略可能依赖于也可能不依赖于他人的战略),从而使自己效用最大化。所有局中人策略构成一个策略组合(Strategy
Profile)。纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下,没有人有足够理由打破这种均衡。
纳什均衡经典案例:囚徒困境
  (1950年,数学家塔克任斯坦福大学客座教授,在给一些心理学家作讲演时,讲到两个囚犯的故事。)
  假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果一个犯罪嫌疑人坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪。如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑8年;如果另一个犯罪嫌人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。表2.2给出了这个博弈的支付矩阵。
  表2.2 囚徒困境博弈
  ——————————————————————————
  ┃ B ┃ B ┃
  ————————┃————————┃————————┃
  ┃ 坦白 ┃ 抵赖 ┃
  ————————┃————————┃————————┃
  A 坦白 ┃ &8, &8 ┃ 0,
  ————————┃————————┃————————┃
  A 抵赖 ┃ &10, 0 ┃ &1,
  ————————┃————————┃————————┃
  关于案例,显然最好的策略是双方都抵赖,结果是大家都只被判1年。但是由于两人处于隔离的情况,首先应该是从心理学的角度来看,当事双方都会怀疑对方会出卖自己以求自保、其次才是亚当·斯密的理论,假设每个人都是“理性的经济人”,都会从利己的目的出发进行选择。这两个人都会有这样一个盘算过程:假如他坦白,我抵赖,得坐10年监狱,坦白最多才8年;他要是抵赖,我就可以被释放,而他会坐10年牢。综合以上几种情况考虑,不管他坦白与否,对我而言都是坦白了划算。两个人都会动这样的脑筋,最终,两个人都选择了坦白,结果都被判8年刑期。
  基于经济学中Rational
agent的前提假设,两个囚犯符合自己利益的选择是坦白招供,原本对双方都有利的策略不招供从而均被释放就不会出现。这样两人都选择坦白的策略以及因此被判8年的结局,纳什均衡”首先对亚当·斯密的“看不见的手”的原理提出挑战:按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。但是我们可以从“纳什均衡”中引出“看不见的手”原理的一个悖论:从利己目的出发,结果损人不利己,既不利己也不利他。
----------------------------------------------------------------------------------------------
帕累托最优(Pareto Optimality)
  帕累托最优是以提出这个概念的意大利经济学家维弗雷多·帕雷托的名字命名的,
维弗雷多·帕雷托在他关于经济效率和收入分配的研究中使用了这个概念。
  帕累托最优(Pareto Optimality),也称为帕累托效率(Pareto
efficiency)。帕累托最优和帕累托改进,是博弈论中的重要概念,并且在经济学、工程学和社会科学中有着广泛的应用。
  帕累托最优是指资源分配的一种状态,在不使任何人境况变坏的情况下,不可能再使某些人的处境变好。
  帕累托改进(Pareto
improvement),是指一种变化,在没有使任何人境况变坏的情况下,使得至少一个人变得更好。
  一方面,帕累托最优是指没有进行帕累托改进余地的状态;另一方面,帕累托改进是达到帕累托最优的路径和方法。帕累托最优是“公平”与“效率”的“理想王国”。
  一般来说,达到帕累托最优时,会同时满足以下3个条件:
  交换最优:即使再交易,个人也不能从中得到更大的利益。此时对任意两个消费者,任意两种商品的边际替代率是相同的,且两个消费者的效用同时得到最大化。
  生产最优:这个经济体必须在自己的生产可能性边界上。此时对任意两个生产不同产品的生产者,需要投入的两种生产要素的边际技术替代率是相同的,且两个生产者的产量同时得到最大化。
  产品混合最优:经济体产出产品的组合必须反映消费者的偏好。此时任意两种商品之间的边际替代率必须与任何生产者在这两种商品之间的边际产品转换率相同。
  如果一个经济体不是帕累托最优,则存在一些人可以在不使其他人的境况变坏的情况下使自己的境况变好的情形。普遍认为这样低效的产出的情况是需要避免的,因此帕累托最优是评价一个经济体和政治方针的非常重要的标准。
  从市场的角度来看,一家生产企业,如果能够做到不损害对手的利益的情况下又为自己争取到利益,就可以进行帕累托改进,换而言之,如果是双方交易,这就意味着双赢的局面。
以上网友发言只代表其个人观点,不代表新浪网的观点或立场。}

我要回帖

更多关于 纳什均衡理论 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信