固定点、稳定分布、纳什均衡——一个困惑的消解

复制子动力学里的固定点、马尔可夫链的稳定分布、博弈论里的纳什均衡。

这三个东西，我第一次看到的时候，是当同义词处理的。

后来发现，不是。

曾经的误解

Fixed Point、Stationary Distribution、Nash Equilibrium。

三个术语，三个领域，三种直觉。听起来像是同一个数学对象的三个侧面。

囚徒困境里，它们确实是同一个东西。

但这不代表它们在任何情况下都等价。我花了点时间才把这个混淆搞清楚。

三个数学对象的定义

固定点（Fixed Point）

复制子动力学是一个常微分方程：

$$\frac{dx}{dt} = F(x)$$

固定点的定义很简单：

$$F(x^*) = 0$$

如果系统刚好到达 $x^*$，它就不再移动。

“速度为零"的点。确定性的。

马尔可夫链稳定分布（Stationary Distribution）

随机过程里，系统永远在随机跳动。静止？不存在的。

于是换了个问题：长期后系统有多大概率出现在各状态？

这就是稳定分布。记作：

$$\pi P = \pi$$

这里 $P$ 是转移矩阵，$\pi$ 是概率分布。

含义是：经过一步随机演化后，概率分布保持不变。

本质上是特征值 $\lambda = 1$ 对应的特征向量。

纳什均衡（Nash Equilibrium）

这是策略概念。

没有人愿意单独改变策略。

它甚至不一定涉及时间。

用矩阵方程求稳定分布

以最简单的两状态马尔可夫链为例。

设群体只有两种状态：

状态 0：全体背叛
状态 1：全体合作

状态向量：

$$p_t = \begin{pmatrix} P(\text{时刻 } t \text{ 在状态 0}) \\ P(\text{时刻 } t \text{ 在状态 1}) \end{pmatrix}$$

转移矩阵：

$$M = \begin{pmatrix} 1-a & a \\ b & 1-b \end{pmatrix}$$

其中 $a$ 是从全背叛变成全合作的概率，$b$ 是从全合作变成全背叛的概率。

囚徒困境里，背叛收益更高，所以 $b > a$。

极端情况下，设 $a = 0$，即一旦全背叛就再也不会回到合作。于是：

$$M = \begin{pmatrix} 1 & 0 \\ b & 1-b \end{pmatrix}$$

求稳定分布 $\pi M = \pi$：

设 $\pi = \begin{pmatrix} x \\ y \end{pmatrix}$，且 $x + y = 1$。

代入：

$$\begin{pmatrix} x & y \end{pmatrix} \begin{pmatrix} 1 & 0 \\ b & 1-b \end{pmatrix} = \begin{pmatrix} x & y \end{pmatrix}$$

计算矩阵乘法：

第一列：$x \cdot 1 + y \cdot b = x + by$

第二列：$x \cdot 0 + y \cdot (1-b) = y(1-b)$

所以：

$$x + by = x$$

移项：

$$by = 0$$

由于 $b > 0$，所以 $y = 0$，进而 $x = 1$。

长期稳定分布是：

$$\pi^* = \begin{pmatrix} 1 \\ 0 \end{pmatrix}$$

即 100% 在"全背叛"状态。

另一种更直观的方式是看 $M^n$ 的极限。

计算矩阵幂次：

$$M = \begin{pmatrix} 1 & 0 \\ b & 1-b \end{pmatrix}$$

注意到这是一个上三角矩阵，其 $n$ 次幂为：

$$M^n = \begin{pmatrix} 1^n & 0 \\ b(1 + (1-b) + (1-b)^2 + \cdots + (1-b)^{n-1}) & (1-b)^n \end{pmatrix}$$

当 $n \to \infty$ 时，$0 < 1-b < 1$ 意味着 $(1-b)^n \to 0$。

而几何级数 $1 + (1-b) + \cdots + (1-b)^{n-1} \to \frac{1}{b}$。

所以：

$$M^n \to \begin{pmatrix} 1 & 0 \\ 1 & 0 \end{pmatrix}$$

无论初始分布如何，长期都会收敛到 $\pi = (1, 0)$。

为什么囚徒困境里三者重合？

因为囚徒困境有吸收态。

当 $x = 0$（全背叛）时：

ODE：$\frac{dx}{dt} = 0$，系统静止
马尔可夫链：概率全部堆积在 $x = 0$，即 $\pi = (1, 0, 0, \ldots)$
纳什均衡：没人愿意改成合作

三者重合。这是一种特殊情况。

三个对象的层次关系

对象	数学含义
特征向量	概率分布不变
固定点	动态停止
纳什均衡	单边偏离无利可图

它们属于不同理论层次：

特征向量来自线性代数
固定点来自微分方程
纳什均衡来自最优响应

只是在囚徒困境这个例子里恰好重合了。

更严格的关系：ESS

在演化博弈论中，经常有这样一个层次关系：

$$\text{ESS} \Rightarrow \text{稳定固定点} \Rightarrow \text{纳什均衡}$$

ESS 是"演化稳定策略”（Evolutionarily Stable Strategy）。

囚徒困境里的全背叛：

是 ESS
是复制子稳定固定点
是纳什均衡
也是随机过程长期稳定状态

所有概念都重合了。

一般博弈里的分离

但这个重合不是必然的。

石头剪刀布。

复制子动力学有中心点可能是固定点，但它未必稳定。马尔可夫稳定分布可能绕圈，动态可能周期振荡。

这时"固定点"、“不变分布”、“纳什均衡"就不再完全相同。

囚徒困境的特殊性在于它有吸收态。在更复杂的博弈里，动态结构会更丰富，三个概念也会分离。

这也是为什么需要分别理解这三个对象，而不是把它们当作同义词。