理解纳什均衡概念 | AI生成和翻译
Question: What is the Nash Equilibrium concept?
Answer:
Nash Equilibrium 是博弈论(game theory)中的一个核心概念,以数学家 John Nash 的名字命名。它描述了非合作博弈中的一种状态:假设所有其他博弈方都不改变策略,任何参与者都无法通过单方面改变自己的策略来获得更高的收益。
Formal Definition
在包含多个博弈方的博弈中,如果一组策略(每个参与者对应一个策略)满足以下条件,则构成 Nash Equilibrium,对于每一位参与者 \(i\):
- 参与者 \(i\) 所选择的策略是对所有其他参与者所选策略的最佳应对(best response)。
- 单独偏离该策略到任何其他策略,都会导致参与者 \(i\) 获得相同或更差的收益。
换句话说,在给定其他人行为的前提下,每个参与者的行为都是最优的。
Example: Prisoner’s Dilemma
使用经典的 Prisoner’s Dilemma 收益矩阵(收益为负的服刑年数;数值越大/越接近 0 越好):
| B Silent (Cooperate) | B Confess (Defect) | |
|---|---|---|
| A Silent (Cooperate) | (–1, –1) | (–3, 0) |
| A Confess (Defect) | (0, –3) | (–2, –2) |
- 双方都坦白 (Defect, Defect) 是 Nash Equilibrium。
- 如果 A 选择坦白,B 的最佳应对是坦白 (–2 > –3)。
- 如果 B 选择坦白,A 的最佳应对也是坦白 (–2 > –3)。
- 任何一方单方面改变策略都无法改善自身处境。
- 双方保持沉默 (Cooperate, Cooperate) 对双方都更好 (–1 > –2),但它不是 Nash Equilibrium,因为每个人都有单方面背叛的动机(如果对方合作,自己背叛的收益 0 > –1)。
Key Properties
- 一个博弈可以有零个、一个或多个 Nash Equilibria。
- Nash Equilibria 可能是 Pareto inefficient 的(如 Prisoner’s Dilemma,虽然共同合作更好但不稳定)。
- 它们可以是 pure strategies(确定性的策略选择)或 mixed strategies(以特定概率随机选择策略)。
- 该概念适用于 non-zero-sum games(大多数现实世界的互动),并假设参与者是理性的且拥有完全信息。
Real-World Applications
- 寡头垄断定价(如企业选择高价或低价)。
- 军备竞赛或国际谈判。
- 交通流分析(如每个人都选择同一条拥堵路线)。
- 进化生物学(种群中的稳定策略)。
Nash 证明了任何具有有限博弈方和有限策略的博弈都至少存在一个 Nash Equilibrium(可能是 mixed strategies)——这一成果使他在 1994 年获得了诺贝尔经济学奖。
Connection to Other Concepts
- Dominant Strategy Equilibrium (更强): 这是一种特殊的 Nash Equilibrium,其中每个参与者的策略无论对手做什么都是最优的。
- Prisoner’s Dilemma 具有一个占优策略均衡,这同时也是它唯一的 Nash Equilibrium。