固定点、稳定分布、纳什均衡——一个困惑的消解

Feb 10, 2023

复制子动力学里的固定点、马尔可夫链的稳定分布、博弈论里的纳什均衡。

这三个东西,我第一次看到的时候,是当同义词处理的。

后来发现,不是。

曾经的误解

Fixed Point、Stationary Distribution、Nash Equilibrium。

三个术语,三个领域,三种直觉。听起来像是同一个数学对象的三个侧面。

囚徒困境里,它们确实是同一个东西。

但这不代表它们在任何情况下都等价。我花了点时间才把这个混淆搞清楚。

三个数学对象的定义

固定点(Fixed Point)

复制子动力学是一个常微分方程:

$$\frac{dx}{dt} = F(x)$$

固定点的定义很简单:

$$F(x^*) = 0$$

如果系统刚好到达 $x^*$,它就不再移动。

“速度为零"的点。确定性的。

马尔可夫链稳定分布(Stationary Distribution)

随机过程里,系统永远在随机跳动。静止?不存在的。

于是换了个问题:长期后系统有多大概率出现在各状态?

这就是稳定分布。记作:

$$\pi P = \pi$$

这里 $P$ 是转移矩阵,$\pi$ 是概率分布。

含义是:经过一步随机演化后,概率分布保持不变。

本质上是特征值 $\lambda = 1$ 对应的特征向量。

纳什均衡(Nash Equilibrium)

这是策略概念。

没有人愿意单独改变策略。

它甚至不一定涉及时间。

用矩阵方程求稳定分布

以最简单的两状态马尔可夫链为例。

设群体只有两种状态:

状态向量:

$$p_t = \begin{pmatrix} P(\text{时刻 } t \text{ 在状态 0}) \\ P(\text{时刻 } t \text{ 在状态 1}) \end{pmatrix}$$

转移矩阵:

$$M = \begin{pmatrix} 1-a & a \\ b & 1-b \end{pmatrix}$$

其中 $a$ 是从全背叛变成全合作的概率,$b$ 是从全合作变成全背叛的概率。

囚徒困境里,背叛收益更高,所以 $b > a$。

极端情况下,设 $a = 0$,即一旦全背叛就再也不会回到合作。于是:

$$M = \begin{pmatrix} 1 & 0 \\ b & 1-b \end{pmatrix}$$

求稳定分布 $\pi M = \pi$:

设 $\pi = \begin{pmatrix} x \\ y \end{pmatrix}$,且 $x + y = 1$。

代入:

$$\begin{pmatrix} x & y \end{pmatrix} \begin{pmatrix} 1 & 0 \\ b & 1-b \end{pmatrix} = \begin{pmatrix} x & y \end{pmatrix}$$

计算矩阵乘法:

第一列:$x \cdot 1 + y \cdot b = x + by$

第二列:$x \cdot 0 + y \cdot (1-b) = y(1-b)$

所以:

$$x + by = x$$

移项:

$$by = 0$$

由于 $b > 0$,所以 $y = 0$,进而 $x = 1$。

长期稳定分布是:

$$\pi^* = \begin{pmatrix} 1 \\ 0 \end{pmatrix}$$

即 100% 在"全背叛"状态。

另一种更直观的方式是看 $M^n$ 的极限。

计算矩阵幂次:

$$M = \begin{pmatrix} 1 & 0 \\ b & 1-b \end{pmatrix}$$

注意到这是一个上三角矩阵,其 $n$ 次幂为:

$$M^n = \begin{pmatrix} 1^n & 0 \\ b(1 + (1-b) + (1-b)^2 + \cdots + (1-b)^{n-1}) & (1-b)^n \end{pmatrix}$$

当 $n \to \infty$ 时,$0 < 1-b < 1$ 意味着 $(1-b)^n \to 0$。

而几何级数 $1 + (1-b) + \cdots + (1-b)^{n-1} \to \frac{1}{b}$。

所以:

$$M^n \to \begin{pmatrix} 1 & 0 \\ 1 & 0 \end{pmatrix}$$

无论初始分布如何,长期都会收敛到 $\pi = (1, 0)$。

为什么囚徒困境里三者重合?

因为囚徒困境有吸收态。

当 $x = 0$(全背叛)时:

三者重合。这是一种特殊情况。

三个对象的层次关系

对象 数学含义
特征向量 概率分布不变
固定点 动态停止
纳什均衡 单边偏离无利可图

它们属于不同理论层次:

只是在囚徒困境这个例子里恰好重合了。

更严格的关系:ESS

在演化博弈论中,经常有这样一个层次关系:

$$\text{ESS} \Rightarrow \text{稳定固定点} \Rightarrow \text{纳什均衡}$$

ESS 是"演化稳定策略”(Evolutionarily Stable Strategy)。

囚徒困境里的全背叛:

所有概念都重合了。

一般博弈里的分离

但这个重合不是必然的。

石头剪刀布。

复制子动力学有中心点可能是固定点,但它未必稳定。马尔可夫稳定分布可能绕圈,动态可能周期振荡。

这时"固定点"、“不变分布”、“纳什均衡"就不再完全相同。

囚徒困境的特殊性在于它有吸收态。在更复杂的博弈里,动态结构会更丰富,三个概念也会分离。

这也是为什么需要分别理解这三个对象,而不是把它们当作同义词。