什么是博弈论?叛逆?主人进来了!!
什么是博弈论?
博弈论,有时也称为博弈理论,是研究斗争或竞争现象的理论和方法。它不仅是现代数学的一个新分支,也是运筹学的一个重要课题。
2.囚徒困境游戏
两个一起作案的小偷被带到警察局单独监禁。如果一方与警方合作,坦白了他与另一方的所作所为,但另一方没有坦白,被坦白的一方将被释放,另一方将被判处三年监禁。如果双方都坦白,则各判1年有期徒刑;如果双方都不坦白,将因警方证据不足被判1个月监禁。这两个小偷会如何抉择?
3.博弈论的发展
博弈论的思想古已有之,而《孙子兵法》不仅是一部军事著作,也是最早的博弈论专著。博弈论起初主要研究棋类、桥牌、赌博的输赢。人们对游戏局势的把握仅仅停留在经验上,并没有发展成为一种理论。直到20世纪初,它才正式发展成为一门学科。1928冯·诺依曼证明了博弈论的基本原理,从而宣告了博弈论的诞生。1944年,冯·诺依曼·摩根斯坦撰写的划时代巨著《博弈论与经济行为》将二人博弈结构扩展到n人博弈结构,并将博弈论体系应用到经济领域,从而奠定了这门学科的基础和理论体系。说到博弈论,就不能忽略博弈论天才纳什,纳什的开创性论文《N人博弈的均衡点》(1950)、《非合作博弈》(1951)等。,并给出纳什均衡的概念和均衡的存在定理。此外,塞尔顿和哈萨尼的研究也促进了博弈论的发展。今天,博弈论已经发展成为一门相对完善的学科。
4.博弈论的基本概念
1)游戏元素
(1)玩家:在一场比赛或游戏中,每一个拥有决策权的参与者都成为玩家。只有两个玩家的游戏现象称为“双人游戏”,两个以上玩家的游戏称为“多人游戏”。
(2)策略:在一场游戏中,每个玩家都有一个切实可行的完整的行动计划,即计划不是某一阶段的行动计划,而是指导整个行动的计划,是每个玩家自始至终的可行计划。
这个局策划的一个行动计划叫做这个局的人的策略。如果一个博弈中的每个人总是有有限个策略,则称为“有限博弈”,否则称为“无限博弈”。
(3)得失:一局结束时的结果叫得失。一局结束时每个局中人的得失不仅与局中人自己选择的策略有关,还与局中人在整个局势中采取的一套政策有关。因此,一个博弈结束时每个参与人的“得失”是所有参与人设定的一组政策的函数,通常称为支付函数。
(4)对于游戏参与者来说,有一个游戏结果。
(5)博弈涉及均衡:均衡就是均衡,在经济学中,均衡就是相关的量处于一个稳定的值。在供求关系中,如果一个商品市场处于某个价格,在这个价格上想买这个商品的人都可以买,想卖的人都可以卖。这个时候,我们说这种商品的供求达到了平衡。所谓纳什均衡就是一个稳定的博弈结果。
纳什均衡:在一个策略组合中,所有参与者都面临着在别人不改变策略的情况下,他的策略是最优的情况。换句话说,如果他此时改变策略,他的支付就会减少。在纳什均衡点上,每个理性的参与者都不会有单独改变策略的冲动。证明纳什均衡点存在的前提是“博弈均衡对”的概念。所谓“均衡夫妇”,是指在两人零和博弈中,当局者A采用其最优策略a*,局者B也采用其最优策略b*。如果玩家A仍然采用b*,但是玩家A采用了另一个策略A,那么玩家A的支付不会超过他原来策略a*的支付。这个结果对于玩家b也是成立的。
这样,“均衡对”就明确定义为:一对策略a*(属于策略集A)和b*(属于策略集B)称为均衡对。对于任何策略A(属于策略集A)和策略B(属于策略集B),总有一个偶对(A,b*)≤偶对(a*,b*)≤。
非零和博弈也有以下定义:一对策略a*(属于策略集A)和b*(属于策略集B)称为非零和博弈的均衡对。对于任意一个策略A(属于策略集A)和策略B(属于策略集B),总有:偶对(A,b*) ≤偶对(a*,b*)玩家A;偶对(a*,b)≤游戏中玩家B的偶对(a*,b*)。
有了上面的定义,纳什定理就立即得到了:
任何有限纯策略的二人对策至少有一个均衡对。这个均衡对叫做纳什均衡点。
纳什定理的严格证明需要不动点理论,不动点理论是研究经济均衡的主要工具。一般来说,找到平衡点的存在性就相当于找到了博弈的不动点。
纳什均衡点的概念提供了一个非常重要的分析方法,使得博弈论研究能够在一个博弈结构中找到更有意义的结果。
但是纳什均衡点的定义仅限于任何不想单方面改变策略的参与人,忽略了其他参与人改变策略的可能性。所以很多时候纳什均衡点的结论是没有说服力的,研究者形象地称之为“天真可爱的纳什均衡点”。
R Selten按照一定的规则剔除了多个均衡中一些不合理的均衡点,从而形成了两个精炼的均衡概念:子博弈完全均衡和颤抖手完美均衡。
2)游戏的类型
(1)合作博弈——研究人们达成合作时如何分配合作的利益,即收益分配问题。
(2)非合作博弈——研究在利益相互影响的情况下,人们如何做出决策,使自己的利益最大化,即策略选择。
(3)完全信息和不完全信息的博弈:玩家对所有参与者的策略空间和策略组合下的支付都有充分的了解,称为完全信息;反之,则称之为信息不完全。
(4)静态博弈和动态博弈
静态博弈:指参与者同时采取行动,或者虽然有先后顺序,但后一个行动者不知道前一个行动者的策略。
动态博弈:指双方的行动顺序,后一个行动者可以知道前一个行动者的策略。
财产分布与Shapley值
考虑这样一个合作博弈:甲、乙、丙、丙投票决定如何分配654.38+0万元,他们分别有50%、40%、654.38+00%的权力。根据规则,一个方案只有在超过50%的投票赞成时才能通过。那么如何分配才合理呢?根据票数分布,50万、B40万、C65438+10万C向A提出:70万、b0、C30万B向A提出:80万、B20万、c0……...
权力指数:每个决策者在决策中的权力体现在他的获胜联盟中“关键进入者”的数量上,“关键进入者”的数量称为权力指数。
Shapley值:在各种可能的联盟秩序下,参与者对联盟的边际贡献之和除以各种可能的联盟组合。
订购abc acb bac bca cab cba
主要进入者
A,B,C的Shapley值分别计算为4/6,1/6,1/6。
所以A,B,C应该分别得到1/3的2/3,1/3,1/3。
5.博弈论的意义
博弈论的研究方法和其他许多运用数学工具研究社会经济现象的学科一样,是从复杂的现象中抽象出基本要素,分析这些要素形成的数学模型,然后逐步引入影响其情境和产生的其他因素,从而分析其结果。
基于不同的抽象层次,形成了三种博弈表达式,可以用来研究各种问题。因此被称为“社会科学的数学”。理论上博弈论是研究理性行动者之间相互作用的形式化理论,但实际上它正在深入到经济学、政治学、社会学等等,被各种社会科学所应用。
1.博弈论是指个人或组织,面对一定的环境条件,在一定的规则下,依靠所掌握的信息,选择并实施自己的行为或策略,并从中获得相应的结果或利益的过程。博弈论是经济学中一个非常重要的理论概念。
什么是博弈论?古语有云,事如棋。生活中的每个人都像一个棋手,每一个动作都像在无形的棋盘上放一枚硬币。聪明而谨慎的棋手,相互揣摩,相互牵制,大家都力争胜,下了许多精彩多变的棋局。博弈论就是研究棋手“下棋”的理性和逻辑部分,并将其系统化为一门科学。换句话说,就是研究个体如何在复杂的互动中获得最合理的策略。实际上,博弈论来源于古代的游戏或棋牌等游戏。数学家通过建立一个自我完整的逻辑框架和体系,抽象具体问题,研究其规律和变化。这不是一项容易的任务。以最简单的双人游戏为例。你想一想,就知道有很大的玄机。如果假设双方都准确地记住了自己和对手的每一步棋,并且都是最“理性”的玩家,那么A在玩的时候,为了赢得比赛,就不得不仔细考虑B的想法,B在玩的时候也不得不考虑A的想法,那么A就不得不认为B在考虑他的想法,B当然知道A已经考虑过了。
面对这样的大雾,博弈论如何开始分析和解决问题,如何找到最优解将抽象的数学问题作为现实的归纳,从而在理论上为指导实践提供可能?现代博弈论是由匈牙利数学家冯·诺依曼在20世纪20年代创立的,他与经济学家奥斯卡·摩根斯坦合作于1944年出版的巨著《博弈论与经济行为》标志着现代系统博弈论的初步形成。对于非合作、纯竞争的博弈,诺依曼只解决两人零和博弈——就像两个人下棋或打乒乓球,一个人赢了一局,另一个人输了另一局,净利润为零。这里的抽象博弈问题是,在给定参与者集合(双方)、策略集合(所有棋步)和利润集合(赢家和输家)的情况下,是否以及如何找到一个理论上的“解”或“平衡”,即对于双方参与者来说最“合理”和最优的具体策略。什么是“合理”?应用传统决定论中的“最小-最大”准则,即博弈的每一方都假设对方所有的优缺点的根本目的都是使自己最大程度地吃亏,并据此优化自己的对策,诺依曼从数学上证明了通过一定的线性运算,每一个二人零和博弈都可以找到一个“最小-最大解”。通过一定的线性运算,两个竞争者以概率分布的形式随机使用一组最优策略中的每一步,从而最终为对方实现最大且相等的利润。当然,言下之意是,这个最优策略并不依赖于对手在博弈中的操作。通俗地说,这个著名的极大极小定理所体现的基本“理性”思想就是“抱最好的希望,做最坏的准备”。
2.在经济学中,“猪的收益”是博弈论的一个著名例子。
这个例子讲的是:猪圈里有两头猪,一头大猪和一头小猪。猪圈的一侧有一个踏板。每踩一次踏板,就会有少量的食物落在猪圈另一侧远离踏板的喂食口。如果一只猪踩了踏板,另一只猪就有机会先吃掉掉在另一边的食物。猪一踩踏板,大猪刚好会在猪跑到食槽前把所有食物吃完;如果大猪踩了踏板,在小猪吃完掉下来的食物之前,还有机会跑到食槽,争夺剩下的另一半。
那么,两只猪会采取什么策略呢?答案是:小猪会选择“搭便车”策略,即在低谷期舒服地等待;大猪不知疲倦地在踏板和食槽之间跑来跑去,只为了一点剩菜。
这是什么原因呢?因为,小猪通过踩踏板什么也得不到,但不踩踏板却能吃到食物。对于小猪来说,不管大猪踩不踩踏板,不踩总是一个不错的选择。另一方面,大猪知道小猪不会踩油门。自己踩油门总比不踩好,所以他得自己来。
“小猪躺着,大猪跑着”的现象是故事里的游戏规则造成的。规则的核心指标是:每次落下的东西数量和踏板到喂食口的距离。
如果改变核心指标,猪圈会不会出现同样的“猪躺着,大猪跑着”的场景?试试吧。
变化方案1:还原方案。喂食只有原来体重的一半。结果小猪和大猪都不蹬了。小猪会踩,大猪会把食物吃完;如果大猪踩上去,小猪也会把食物吃完。谁蹬就意味着给对方贡献食物,所以谁也不会有蹬的动力。
如果目的是让猪多蹬,这个游戏规则的设计显然是失败的。
变化方案二:增量方案。比以前多喂一倍。结果小猪和大猪都会蹬。谁想吃就蹬。反正对方不会一次吃完所有的食物。小猪和大猪相当于生活在一个物质相对丰富的“物欲横流”的社会,竞争意识不是很强。
对于游戏规则的设计者来说,这个规则的成本是相当高的(一次提供双份食物);而且因为竞争不强,让猪多蹬也没啥效果。
变化方案三:减量加移位方案。只喂原来重量的一半,但同时要把喂食口移到踏板附近。结果小猪和大猪都拼命蹬。等的人不会吃,努力的人会得到更多。每一次收获都只是花。
对于游戏设计师来说,这是最好的解决方案。成本不高,但收获最大。
《智猪游戏》的原著故事,启发了竞争中的弱者(猪)等待最佳策略。但是对于社会来说,小猪搭便车时的社会资源分配并不是最优的,因为小猪没能参加比赛。为了使资源得到最有效的配置,规则的设计者不希望看到任何人搭便车,政府也是如此,公司的老板也是如此。能否彻底杜绝“搭便车”现象,取决于游戏规则的核心指标设置是否得当。
比如公司的激励制度设计,奖励太强,而且还是持股和期权。公司的所有员工都成了百万富翁。且不说成本高,员工的积极性也不一定高。这相当于“聪明猪游戏”
增量方案描述的情况。但是,如果奖励力度不大,观众有分成(即使是不干活的“小猪”),曾经很努力的大猪们也就没有动力了——就像《聪明猪游戏》第一期缩减计划中描述的情况。最好的激励机制设计就好比换第三种方案——减员加换班。奖励不是人人共享,而是针对个人(如业务比例提成),既节约了成本(对公司而言),又杜绝了“搭便车”现象,可以实现有效激励。
很多人没看过“聪明猪游戏”的故事,但都在有意识地使用猪的策略。散户在股市里等着庄家上轿;等待产业市场出现有利可图的新产品,然后大规模复制游资牟取暴利;公司里不创造效益但分享成果的人,等等。所以,对于制定经济管理的各种游戏规则的人来说,他们必须明白“聪明猪游戏”的指数变化的原因。
3.背景知识:纳什博弈论的原理和应用。
北京晚报
纳什在1950和1951年关于非合作博弈论的两篇重要论文,彻底改变了人们对竞争和市场的看法。他证明了非合作博弈及其均衡解,并证明了均衡解的存在性,即著名的纳什均衡。从而揭示了博弈均衡与经济均衡的内在联系。纳什的研究奠定了现代非合作博弈论的基石,后来的博弈论研究基本遵循了这条主线。然而,纳什的天才发现遭到了冯·诺依曼的断然否定,在此之前,他还受到了爱因斯坦的冷遇。但骨子里挑战和鄙视权威的天性,让纳什坚持自己的观点,最终成为大师。要不是三十多年的严重精神疾病,恐怕他早就
站在诺贝尔奖的领奖台上,我永远不会和别人分享这份荣誉。
纳什是一位非常有才华的数学家,他的主要贡献是在1950到1951在普林斯顿攻读博士学位时做出的。但他的天才发现,非合作博弈的均衡,即“纳什均衡”,并不是一帆风顺的。
1948纳什赴普林斯顿大学攻读数学博士学位。那年他还不到20岁。当时的普林斯顿,人杰地灵,高手如云。爱因斯坦、冯·诺依曼、列夫谢茨(数学系系主任)、阿尔伯特·塔克、阿伦佐·切赫、哈罗德·库恩、诺曼·斯汀·罗德斯、精灵福克斯等。都在这里。博弈论主要由冯·诺依曼(1903—1957)创立。他是出生于匈牙利的天才数学家。他不仅创立了经济博弈论,还发明了计算机。早在20世纪初,策梅洛、波莱尔和冯·诺依曼就已经开始研究博弈的精确数学表达式。直到1939,冯·诺依曼认识了经济学家奥斯卡·莫根施特恩,并与他合作,使博弈论进入了经济学的广阔领域。
65438-0944年,他与奥斯卡·摩根斯坦合著的代表作《博弈论与经济行为》出版,标志着现代系统博弈论的初步形成。虽然对游戏性质问题的研究可以追溯到19世纪甚至更早。比如1838的古诺简单双寡头博弈;1883的伯特兰和1925的埃奇沃斯研究了两个寡头的产量和价格垄断;2000多年前,我国著名军事家孙武的后人孙膑用博弈论帮助田忌赢得赛马,等等,都是早期博弈论的萌芽,特点是研究零星分散,偶然性大,无系统。冯·诺依曼和摩根·斯特恩在《博弈论与经济行为》一书中提出的标准、扩展和合作博弈模型解的概念和分析方法奠定了这门学科的理论基础。合作博弈在20世纪50年代达到顶峰。然而,诺依曼博弈论的局限性日益暴露。由于过于抽象,其应用范围受到很大限制。长期以来,人们对博弈论的研究知之甚少,博弈论只是少数数学家的专利,因此其影响力非常有限。正是在这个时候,非合作博弈——“纳什均衡”应运而生,它标志着博弈论新时代的开始!纳什不是一个按部就班的学生。他经常逃学。据他的同学回忆,他们根本不记得什么时候和纳什一起上过完整的必修课,但纳什辩称,他至少上过Steen Rhodes的代数拓扑。Steen Rhodes是这门学科的创始人,但上了几节课之后,Nash认定这门课程不合他的口味。于是他又走了。然而,纳什毕竟是一个具有天赋的非凡人物。他对数学王国的每一个分支都深深着迷,比如拓扑学、代数几何、逻辑学、博弈论等等。纳什经常表现出他与众不同的自信和自负,充满了咄咄逼人的学术野心。1950整个夏天,纳什都在忙于紧张的考试,他的博弈论研究被打断,他觉得这是一种极大的浪费。不知道这种暂时的“放弃”,在潜意识的不断思考下,已经逐渐形成了清晰的脉络,顿时灵感迸发!今年10的月份,他突然感到了一股才华和梦想的涌动。其中最耀眼的亮点就是非合作博弈均衡的概念,这一概念在未来将被称为“纳什均衡”。纳什的主要学术贡献体现在1950和1951的两篇论文(包括一篇博士论文)中。只是到了1950,他才把自己的研究成果写成了一篇题为《非合作博弈》的长篇博士论文,发表在1950+01的《美国科学院月报》上,立刻引起了轰动。说起来,全靠大卫·盖尔修士的作品了。就在被冯·诺依曼降格后没几天,他遇到了盖尔,告诉他,他把冯·诺依曼的“极大极小解”推进到了非合作博弈领域,找到了普适的方法和均衡点。盖尔仔细听着。他终于意识到,纳什的想法,比冯·诺依曼的合作博弈论,更能反映真实情况,其严谨而优美的数学证明给他留下了极其深刻的印象。盖尔建议他整理一下,马上发表,以免别人捷足先登。纳什,一个初出茅庐的男孩,不知道竞争的危险,也从未想过要这样做。于是,盖尔充当了他的“代理人”,代他起草了给科学院的短信。该部门的负责人Lev Shetz亲自将手稿提交给了科学院。纳什写的文章不多,就那么几篇,但也足够了,因为都是名列前茅的。这一点也值得深思。国内一个教授需要在“核心期刊”上发表多少篇文章?按照这个标准,纳什可能不够格。
莫里斯,65438-0996年诺贝尔经济学奖得主,在牛津大学担任埃奇沃思经济学教授时,没有发表过任何文章。特殊人才要有特殊的选拔方式。
纳什大学时就开始研究纯数学的博弈论,65438到0948进入普林斯顿大学后变得更加游刃有余。二十出头的时候,他已经成为世界著名的数学家。特别是在经济博弈论领域,他做出了划时代的贡献,是继冯·诺依曼之后最伟大的博弈论大师之一。他提出的著名的纳什均衡概念在非合作博弈理论中起着核心作用。后来的研究者对博弈论的贡献都是基于这个概念。纳什均衡的提出和不断完善,为博弈论在经济学、管理学、社会学、政治学、军事学等领域的广泛应用奠定了坚实的理论基础。
囚徒困境:
关于“囚徒困境”
在博弈论中,占优战略均衡的一个著名例子是塔克给出的“囚徒困境”博弈模型。这个模型以一种特殊的方式告诉我们一个警察和一个小偷的故事。假设甲、乙两个小偷共同作案,私自入室,被警察抓住。警察把这两个人放在两个不同的房间里审讯。对于每一个嫌疑人,警方给出的政策是,如果一个嫌疑人交代了自己的罪行,交出了赃物,证据确凿,两人都定罪。如果另一名嫌疑人也供认不讳,他们各被判处8年徒刑;如果另一个犯罪嫌疑人在没有坦白的情况下否认,会以妨碍公务罪(因为有证据证明他有罪)再判两年有期徒刑,坦白者减刑八年后立即释放。如果两人都否认,警方因证据不足不能判他们盗窃罪,但可以以非法侵入罪各判1年有期徒刑。表2.2显示了这个博弈的收益矩阵。
表2.2囚徒困境博弈
B
承认否认
a忏悔–8,–8 0,–10
拒绝–10,0–1,–1
让我们看看这个博弈的可预测均衡是什么。对于A来说,他虽然不知道B选择什么,但是他知道不管B选择什么,选择“表白”永远是对他最好的。很明显,根据对称性,B也会选择“表白”。结果两人都被判有期徒刑8年。但如果都选择“否认”,每人只判1年。在表2.2的四个行动选择组合中,(否认,否定)是帕累托最优的,因为任何偏离这个行动选择组合的其他行动选择组合至少会使一个人的处境更糟。不难看出,“坦白”是任何犯罪嫌疑人的优势策略,而(坦白,认罪)是一个优势战略均衡。
??????????????????????????
达利理论中的一个小故事
要理解纳什的贡献,首先要知道什么是非合作博弈问题。目前几乎所有的博弈论教材都会讲到“囚徒困境”的例子,每本书里的例子都差不多。
博弈论毕竟是数学,或者说,是运筹学的一个分支。谈论经典和学说,自然少不了数学语言,在外行人看来不过是一大堆数学公式。好在博弈论关注的是日常经济生活,不能不吃烟花。这个理论其实是从象棋、扑克、战争等带有竞争、对抗、决策性质的问题中借用来的术语。听起来有点玄乎,但实际上有着重要的现实意义。博弈论大师看经济社会问题就像下棋一样,往往在博弈中有深刻的道理。所以,从日常生活中的琐事入手,以身边的故事为例进行讲解,并不枯燥。一天,一个富人在家里被杀,他的财产被盗。在这起案件的调查过程中,警方抓获了两名犯罪嫌疑人斯卡菲和纳库尔斯,并从他们的住处找到了被害人家中的失物。但他们否认自己杀了人,辩称是先杀了有钱人,然后他们只是偷了东西。于是民警将两人隔离,分别放在不同的房间审讯。地方检察官会和每个人单独谈话。公诉人说,“因为你有盗窃的确凿证据,可以判你一年有期徒刑。”但是我可以和你做个交易。如果你单独承认谋杀,我只会判你三个月监禁,但你的同伙会判十年监禁。如果你拒绝坦白,被伴侣举报,你会被判十年有期徒刑,他只会被判三个月有期徒刑。但是,如果你们都坦白,那么你们都将被判处五年监禁。“Scalfi和Nacoors应该怎么做?他们面临着一个两难的境地——坦白还是否认。很明显,最好的策略是双方都否认,结果大家都只判一年。但由于两人处于隔离状态,无法表白。所以,根据亚当·斯密的理论,每个人都是从利己的目的出发,他们选择忏悔是最好的策略。因为如果你坦白,你可以期待三个月的短期监禁,但前提是你的伴侣否认,这显然比你自己否认的10年监禁要好。这种策略是损人利己的。不仅如此,表白还有更多好处。如果对方坦白否认,就要坐牢10年。太不划算了!所以,在这种情况下,还是应该选择坦白。就算两个人同时坦白,最多也只判五年,总比判10年强。所以两者合理的选择是坦白,原本对双方都有利的策略(否认)和结局(判1年有期徒刑)都不会出现。这样两个人都选择了弗兰克策略而被判五年的结果叫做“纳什均衡”,也叫非合作均衡。因为,每一方在选择策略时,并不存在“共谋”(勾结),他们只是选择对自己最有利的策略,而不考虑社会福利或任何其他对手的利益。换句话说,这个策略组合是由所有参与者(也称为当事人和参与者)的最佳策略组合组成的。没有人会为了给自己争取更大的利益而主动改变策略。”囚徒困境”具有广泛而深刻的意义。个人理性和集体理性的冲突,每个人对自身利益的追求,导致一个“纳什均衡”,这也是一个对所有人都不利的结局。两人都是在坦白否认的策略中先想到自己,所以必然要服长刑期。只有都先想到对方,或者互相勾结(勾结),才能得到最短监禁的结果。纳什均衡首先挑战亚当·斯密的“看不见的手”原理。根据斯密的理论,在市场经济中,每个人都是从利己的目的出发,最终整个社会达到利他的效果。让我们回顾一下这位经济圣人在《国富论》中的名言:“通过追求(个人)私利,他常常比他实际想做的更有效地促进社会利益。“从‘纳什均衡’引出一个‘看不见的手’原理的悖论:从利己出发,结果不是利己,既不是利己,也不是利己。这是两个囚犯的命运。从这个意义上说,纳什均衡提出的悖论实际上动摇了西方经济学的基石。所以,从纳什均衡中,我们也可以悟出一个道理:合作是有利的“利己策略”。但它必须符合以下黄金律:你希望别人如何对待你,你就如何对待别人,但前提是别人也这样做。那就是中国人说的,“己所不欲,勿施于人”。但前提是你不要对我做你不想让我做的事。其次,“纳什均衡”是非合作博弈均衡。现实中,非合作情况比合作情况更普遍。因此,“纳什均衡”是冯·诺依曼和摩根·斯特恩合作博弈论的重大发展,甚至可以说是一场革命。
从纳什均衡的普遍意义上,我们可以深刻理解经济、社会、政治、国防、管理和日常生活中常见的博弈现象。我们会举很多类似于“囚徒困境”的例子。比如价格战,军事竞争,污染等等。一般的博弈问题由三个要素组成:玩家,也称当事人、参与者和策略的集合,策略的集合以及每个玩家所做的选择。