复制子动力学里的固定点、马尔可夫链的稳定分布、博弈论里的纳什均衡。
这三个东西,我第一次看到的时候,是当同义词处理的。
后来发现,不是。
曾经的误解
Fixed Point、Stationary Distribution、Nash Equilibrium。
三个术语,三个领域,三种直觉。听起来像是同一个数学对象的三个侧面。
囚徒困境里,它们确实是同一个东西。
但这不代表它们在任何情况下都等价。我花了点时间才把这个混淆搞清楚。
三个数学对象的定义
固定点(Fixed Point)
复制子动力学是一个常微分方程:
$$\frac{dx}{dt} = F(x)$$固定点的定义很简单:
$$F(x^*) = 0$$如果系统刚好到达 $x^*$,它就不再移动。
“速度为零"的点。确定性的。
马尔可夫链稳定分布(Stationary Distribution)
随机过程里,系统永远在随机跳动。静止?不存在的。
于是换了个问题:长期后系统有多大概率出现在各状态?
这就是稳定分布。记作:
$$\pi P = \pi$$这里 $P$ 是转移矩阵,$\pi$ 是概率分布。
含义是:经过一步随机演化后,概率分布保持不变。
本质上是特征值 $\lambda = 1$ 对应的特征向量。
纳什均衡(Nash Equilibrium)
这是策略概念。
没有人愿意单独改变策略。
它甚至不一定涉及时间。
用矩阵方程求稳定分布
以最简单的两状态马尔可夫链为例。
设群体只有两种状态:
- 状态 0:全体背叛
- 状态 1:全体合作
状态向量:
$$p_t = \begin{pmatrix} P(\text{时刻 } t \text{ 在状态 0}) \\ P(\text{时刻 } t \text{ 在状态 1}) \end{pmatrix}$$转移矩阵:
$$M = \begin{pmatrix} 1-a & a \\ b & 1-b \end{pmatrix}$$其中 $a$ 是从全背叛变成全合作的概率,$b$ 是从全合作变成全背叛的概率。
囚徒困境里,背叛收益更高,所以 $b > a$。
极端情况下,设 $a = 0$,即一旦全背叛就再也不会回到合作。于是:
$$M = \begin{pmatrix} 1 & 0 \\ b & 1-b \end{pmatrix}$$求稳定分布 $\pi M = \pi$:
设 $\pi = \begin{pmatrix} x \\ y \end{pmatrix}$,且 $x + y = 1$。
代入:
$$\begin{pmatrix} x & y \end{pmatrix} \begin{pmatrix} 1 & 0 \\ b & 1-b \end{pmatrix} = \begin{pmatrix} x & y \end{pmatrix}$$计算矩阵乘法:
第一列:$x \cdot 1 + y \cdot b = x + by$
第二列:$x \cdot 0 + y \cdot (1-b) = y(1-b)$
所以:
$$x + by = x$$移项:
$$by = 0$$由于 $b > 0$,所以 $y = 0$,进而 $x = 1$。
长期稳定分布是:
$$\pi^* = \begin{pmatrix} 1 \\ 0 \end{pmatrix}$$即 100% 在"全背叛"状态。
另一种更直观的方式是看 $M^n$ 的极限。
计算矩阵幂次:
$$M = \begin{pmatrix} 1 & 0 \\ b & 1-b \end{pmatrix}$$注意到这是一个上三角矩阵,其 $n$ 次幂为:
$$M^n = \begin{pmatrix} 1^n & 0 \\ b(1 + (1-b) + (1-b)^2 + \cdots + (1-b)^{n-1}) & (1-b)^n \end{pmatrix}$$当 $n \to \infty$ 时,$0 < 1-b < 1$ 意味着 $(1-b)^n \to 0$。
而几何级数 $1 + (1-b) + \cdots + (1-b)^{n-1} \to \frac{1}{b}$。
所以:
$$M^n \to \begin{pmatrix} 1 & 0 \\ 1 & 0 \end{pmatrix}$$无论初始分布如何,长期都会收敛到 $\pi = (1, 0)$。
为什么囚徒困境里三者重合?
因为囚徒困境有吸收态。
当 $x = 0$(全背叛)时:
- ODE:$\frac{dx}{dt} = 0$,系统静止
- 马尔可夫链:概率全部堆积在 $x = 0$,即 $\pi = (1, 0, 0, \ldots)$
- 纳什均衡:没人愿意改成合作
三者重合。这是一种特殊情况。
三个对象的层次关系
| 对象 | 数学含义 |
|---|---|
| 特征向量 | 概率分布不变 |
| 固定点 | 动态停止 |
| 纳什均衡 | 单边偏离无利可图 |
它们属于不同理论层次:
- 特征向量来自线性代数
- 固定点来自微分方程
- 纳什均衡来自最优响应
只是在囚徒困境这个例子里恰好重合了。
更严格的关系:ESS
在演化博弈论中,经常有这样一个层次关系:
$$\text{ESS} \Rightarrow \text{稳定固定点} \Rightarrow \text{纳什均衡}$$ESS 是"演化稳定策略”(Evolutionarily Stable Strategy)。
囚徒困境里的全背叛:
- 是 ESS
- 是复制子稳定固定点
- 是纳什均衡
- 也是随机过程长期稳定状态
所有概念都重合了。
一般博弈里的分离
但这个重合不是必然的。
石头剪刀布。
复制子动力学有中心点可能是固定点,但它未必稳定。马尔可夫稳定分布可能绕圈,动态可能周期振荡。
这时"固定点"、“不变分布”、“纳什均衡"就不再完全相同。
囚徒困境的特殊性在于它有吸收态。在更复杂的博弈里,动态结构会更丰富,三个概念也会分离。
这也是为什么需要分别理解这三个对象,而不是把它们当作同义词。