纳什均衡理论(博弈论十大定律)

发布时间:2025-12-10 04:06:04 浏览次数:1

纳什,又称非合作博弈均衡,是博弈论中的一个重要术语,以约翰·纳什(johnf nash)命名。在一个博弈的过程中,不管对方的策略选择如何,一方都会选择某种策略,这种策略称为优势策略。如果博弈中两个局中人的策略组合构成了各自的优势策略,那么这个组合就定义为纳什均衡。

策略的组合被称为纳什均衡。当每个参与者的均衡策略是实现最大期望收益时,同时,所有其他参与者也遵循这一策略。

纳什很平衡。

奠定非合作博弈论发展基础的重要成果,如纳什均衡的普遍意义、存在定理的证明等,都是约翰·纳什在普林斯顿大学攻读博士学位时完成的。事实上,对博弈论的研究始于1944年冯·诺依曼和奥斯卡·摩根斯坦合著的《博弈论与经济行为》一书。然而,是纳什首先用严格的数学语言和简洁的文字准确地定义了纳什均衡的概念,并在包含“混合策略”的情况下,证明了N人有限博弈中纳什均衡的普遍存在,从而创立了完全不同于诺伊曼和摩根斯坦框架线的“非合作博弈”理论,进而对“合作博弈”作了进一步的分析,阿尔伯特·塔克教授在他的论文中评论道,“这是对博弈论的一个高度原创性的重要贡献。它发展了N人有限非合作对策的概念和性质,这本身是有意义的。而且很可能会打开除了两个人之间的零和问题之外,很多还没有涉及到的问题。在观念和方法上,这篇论文是作者的独立创作。”

纳什均衡例子

1.囚徒困境

博弈论的一个著名例子是囚徒困境。囚徒困境是非零和博弈。据说A和B两个嫌疑人一起进入私宅作案,被警察抓了,没有证据。于是警方分别对两名嫌疑人进行了审讯。警官分别告诉两个犯人,如果你坦白,对方不坦白,你判3个月,对方判10年;如果两人都不招供,就各被拘留一年,因为他们没有证据就进了屋;如果两人都认罪,各判五年。于是,两人陷入了坦白还是不坦白的两难境地。结果A虽然不知道B有没有坦白,但他觉得选择“坦白”对他最好,于是A会选择“坦白”,B也会选择“坦白”,两人都被判了五年。两人都选择不坦白。虽然证据不足,但不会出现因进入私宅而拘留每个人一年的结果。

矩阵犯人A坦白不坦白,犯人B坦白判刑五年,犯人A判刑十年;乙被判三个月不招供,甲被判三个月;b判十年一年。

在一个博弈的过程中,不管对方的策略选择如何,一方都会选择某种策略,这种策略称为优势策略。如果博弈中两个局中人的策略组合构成了各自的优势策略,那么这个组合就定义为纳什均衡。纳什均衡又称非合作博弈均衡,是博弈论中的一个重要术语。它是以美国数学家纳什的名字命名的,他将成为未来电影《美丽心灵》的主人公。在上面这个囚徒困境的例子中,两个囚徒为了自己的利益,选择了坦白。这种两个人都选择坦白,被判五年的策略就是“纳什均衡”。

狩猎

两个猎人出发去打猎。假设一只鹿有400公斤肉,但是两个人要合作才能得到。一个人什么也得不到。同一地区有一群兔子,总共200多斤肉。两个人一起可以把他们全部打下来,但是一个人也可以得到100公斤的肉。双方猎人都知道对方的平衡策略,但无论如何都无法影响对方的决定。最后的结果会是什么?

结果决定阿巴布猎鹿200200猎鹿0100猎兔1000猎鹿1000猎兔100100猎兔

有两个纳什均衡。

(1)两人都猎鹿:任何一方单方面转行猎兔,收入从200降到100。

(2)两人都猎兔:任何人单方面转行猎鹿,都会使其收入从100降到0。

注意,都是单方面的改变。如果双方同时从兔子转为鹿会更好——但纳什均衡不考虑这个。

这也产生了一个问题:纳什均衡不一定是“理性”的,也不一定是整体的最优解,但对每个人来说,都是别人失控时自己的最优解。

纳什均衡的重要影响

纳什均衡理论奠定了现代主流博弈论和经济理论的根本基础。正如Kreps (1990)在《博弈论与经济建模导论》中所说,“在过去的一二十年里,经济学经历了方法论、语言、概念等方面的温和革命。非合作博弈论已成为范式的中心…在经济学或金融,会计,市场营销和政治相关的经济原则。纳什的重要影响可以概括为以下六个方面(谢志宇,1999):

(1)改变了经济学的体系和结构。非合作博弈论的概念、内容、模型和分析工具已经渗透到微观经济学、宏观经济学、劳动经济学、国际经济学、环境经济学等经济学学科的大部分学科中,改变了这些学科的内容和结构,成为这些学科的基本研究范式和理论分析工具,从而改变了原有经济学理论体系各个分支的内涵。

(2)扩大经济学的经济研究范围。原始经济学缺乏对不确定因素、变化的环境因素以及经济个体之间的相互作用进行建模的有效方法,因此无法解剖和分析微观层面的经济问题。纳什均衡及相关模型分析方法,包括扩展博弈方法、逆向归纳法、子博弈完美纳什均衡等概念方法,为经济学家提供了深入的分析工具。

(3)加强经济研究的深度。纳什均衡理论并不回避经济个体之间的直接互动,也不满足于经济个体之间复杂经济关系的简化处理。在分析问题时,不仅仅停留在宏观层面,而是深入分析表象背后的深层次原因和规律,强调从微观个体行为规律的角度发现问题的根源,从而更深入、更准确地理解和解释经济问题。

(4)形成了基于经典博弈论的研究范式体系。也就是说,可以根据经典博弈的类型或特点对各种问题或经济关系进行分类,研究经典博弈相应的分析方法和模型,从而可以很容易地将一个领域获得的经验移植到另一个领域。

(5)扩大和加强经济学与其他社会科学和自然科学的联系。纳什之所以伟大,是因为它很普通,普通到几乎无处不在。纳什均衡理论不仅适用于人类的行为规律,也适用于除人类以外的其他生物的生存、运动和发展规律。纳什均衡与博弈论之间的桥梁,使得经济学与其他社会科学和自然科学的联系更加紧密,形成了经济学与其他学科相互促进的良性循环。

(6)改变了经济学的语言和表达方式。在进化博弈论方面颇有造诣的Kandori (1997)对Paul Samuelson说过一句名言,“你甚至可以把一只鹦鹉变成一个训练有素的经济学家,因为它只需要学会两个词,即‘供给’和‘需求’。”他曾经幽默地引申说:“现在这只鹦鹉需要再学两个单词。”

纳什均衡案例分析

案例1:纳什均衡在货币政策效应中的应用

一,博弈论下的货币政策博弈分析

货币博弈分析运用博弈论分析宏观金融博弈问题。因此,博弈论是宏观金融博弈分析的方法论基础。纳什于1950年和1951年发表了两篇关于非合作博弈的重要文章,在一般意义上定义了非合作博弈及其均衡解,并证明了均衡的存在,基本奠定了现代非合作博弈理论的基础。所以这个均衡后来被博弈论称为“纳什均衡”。即由所有参与者的最优策略组成的策略组合。给定这个策略组合中其他参与人的策略,没有单个参与人有选择其他策略的主动权,所以没有人主动打破这个均衡。相反,如果存在一个均衡或制度安排,如果不是纳什均衡,即不是所有参与者的最优策略组合,那么这个组合就不能成立或者至少不能持续。合作博弈强调群体理性、效率和公平。非合作博弈强调个人理性和个人最优决策。结果可能有效,也可能无效。现实中大量的经济博弈问题都是非合作博弈。非合作博弈理论的发展为其在经济研究中的广泛应用创造了条件,促进了合作博弈的进一步发展。

纳什均衡假设当玩家选择自己的策略时,他们把其他玩家的策略看作是给定的。不考虑自己的选择如何影响游戏中对手的选择。这个假设在静态博弈中成立,但在动态博弈中不成立。

在静态博弈中,所有参与者同时行动,不可能先观察别人的行动再采取自己的行动,因此没有时间做出反应。但是,在动态博弈中,一方的动作在先,另一方的动作在后。后者自然会根据前者的选择调整自己的选择,而前者也会合理预期到这一点,因此需要考虑其选择对其他参与者的影响。由于决策者不考虑自己的选择对他人选择的影响,纳什均衡允许不可置信威胁的存在。1965年,Selten将纳什均衡的概念引入动态分析,定义了子博弈精炼纳什均衡的概念。将不可信的威胁策略从纳什均衡中剔除,从而解决了求解完全信息动态博弈均衡的问题,将不可信的策略转化为可信策略的行动,即经济学中的承诺行动”。当事人不履行承诺,就要付出相应的代价。这个承诺是可信的,否则就是不可信的。这一概念为博弈论研究货币政策奠定了基础。

二、纳什均衡在货币政策效果中的应用

在理性预期的条件下,我们考察了第一期货币政策的博弈均衡。假设中央银行的目标成本函数是:

其中:π是通货膨胀率;y是实际经济增长率;Y *是央行的预期经济增长率。

根据卢卡斯供给曲线:y = yn+α (π π e),α>;0.其中包括:

是潜在经济增长率;

是公众的预期通货膨胀率:A表示非预期通货膨胀对经济的影响程度,即总供给曲线的斜率。

设α=1,即y = yn+(π π α)

同时,假设中央银行完全控制货币增长。公众的预期是完全理性的,不存在真实供给冲击和货币流通速度变化的影响。通胀率π等于货币供应量增长率M,通胀预期π α。等于货币供应量增长率me,央行预期经济增长率等于潜在经济增长率。有

公众的目标函数是避免预期误差导致的通货膨胀,所以公共效用函数可以定义为:u = (m me) 2。

货币政策博弈的支付矩阵如下:

中央银行策略(M)公共策略(ME) 010 (0,0) (0,0,5) 1 (1,-1) (0,5,0)

矩阵中M=0表示央行选择零货币增长率,m=1表示央行选择正货币增长率:公共策略含义同上。从支付矩阵可以看出,对于中央银行来说,m=1的效用严格优于m=0的效用,M = 1是其最优策略。在理性预期下,公众很快意识到,央行会选择一个正的货币增长率,它必须选择m=1才能使其效用最大化。这个博弈模型的纳什均衡是央行选择正的货币增长率,公众选择正的通货膨胀率预期,效用函数为(0,5,0)。均衡结果表明,货币政策只会影响通货膨胀率,实际产出保持不变。

货币政策博弈体现在货币政策决策和执行过程中的动态不一致。博弈主体目前做出的关于未来的最优决策在决策执行时对决策者来说不再是最优决策,他必须调整自己的决策。例如,在公众预期形成之前,零通胀(或更低的通胀)可能是货币政策制定者的**选择。所以,为了影响公众预期,他可能会在这里选择并承诺,他会实行零通胀(或者更低的通胀)。然而,当公众预期形成时,零通胀(或更低的通胀)对政策制定者来说不再是**决策。为了获得意外通货膨胀对经济增长和就业增加的刺激作用,政策制定者必须实施正的(或更高的)通货膨胀。在信息完全的情况下,公众知道决策者会这样做。因此,他的承诺令人难以置信。拥有理性和完整信息的公众不会被它愚弄。最终结果必然是预期的正(或更高)通货膨胀。选择货币政策的通胀(通缩)倾向是由博弈结构的内生性决定的,即均衡(纳什均衡)允许存在不可置信的威胁策略,央行做出的零通胀(或低通胀)承诺是不可置信的。

为了消除货币政策的通货膨胀(通货紧缩)倾向,必须消除这种不可置信的因素——央行承诺在公众预期形成之前实施单一的货币政策规则不变,央行通过承诺行动获得了影响公众预期的能力。因此,在选择货币供应量增长率时,我们必须考虑其对公众预期的即时和全面影响,我们不能指望创造意外的通胀(通缩)来刺激经济、增加就业或为预算融资。也就是说,提高政策的稳定性和可信度是消除通胀(通缩)的关键。

需要做网站?需要网络推广?欢迎咨询客户经理 13272073477