固定点、稳定分布、纳什均衡——一个困惑的消解

Fri, 10 Feb 2023 00:00:00 +0000

复制子动力学里的固定点、马尔可夫链的稳定分布、博弈论里的纳什均衡。

这三个东西，我第一次看到的时候，是当同义词处理的。

后来发现，不是。

曾经的误解

Fixed Point、Stationary Distribution、Nash Equilibrium。

三个术语，三个领域，三种直觉。听起来像是同一个数学对象的三个侧面。

囚徒困境里，它们确实是同一个东西。

但这不代表它们在任何情况下都等价。我花了点时间才把这个混淆搞清楚。

三个数学对象的定义

固定点（Fixed Point）

复制子动力学是一个常微分方程：

$$\frac{dx}{dt} = F(x)$$

固定点的定义很简单：

$$F(x^*) = 0$$

如果系统刚好到达 $x^*$，它就不再移动。

“速度为零"的点。确定性的。

马尔可夫链稳定分布（Stationary Distribution）

随机过程里，系统永远在随机跳动。静止？不存在的。

于是换了个问题：长期后系统有多大概率出现在各状态？

这就是稳定分布。记作：

$$\pi P = \pi$$

这里 $P$ 是转移矩阵，$\pi$ 是概率分布。

含义是：经过一步随机演化后，概率分布保持不变。

本质上是特征值 $\lambda = 1$ 对应的特征向量。

纳什均衡（Nash Equilibrium）

这是策略概念。

没有人愿意单独改变策略。

它甚至不一定涉及时间。

用矩阵方程求稳定分布

以最简单的两状态马尔可夫链为例。

设群体只有两种状态：

状态 0：全体背叛
状态 1：全体合作

状态向量：

$$p_t = \begin{pmatrix} P(\text{时刻 } t \text{ 在状态 0}) \\ P(\text{时刻 } t \text{ 在状态 1}) \end{pmatrix}$$

转移矩阵：

随机演化过程

Sat, 28 Jan 2023 00:00:00 +0000

上篇文章甩出了复制子动力学方程 $\frac{dx}{dt} = x(1-x)(\pi_C - \pi_D)$。没解释从哪来的。

憋着难受。今天补上。

这个方程不是拍脑袋写出来的。它的背后，是"大量个体随机互动"的宏观涌现。说人话：一群人瞎折腾，最后折腾出了规律。

微观随机，宏观确定。这是演化博弈论最迷人之处。

从离散随机过程开始

还是囚徒困境。

群体 $N$ 人，策略只有两种：C 或 D。

记时刻 $t$ 的合作者数量为 $k$。那么合作比例 $x = \frac{k}{N}$。

系统状态？只需要跟踪 $k = 0, 1, 2, \ldots, N$。

这活脱脱一个马尔可夫链（Markov Chain）——下一步长什么样，只看现在，不问过去。

演化规则

规则简单到有点粗暴：

随机抽一个人当"复制源"
被抽中概率和收益挂钩
再随机抽一个人，被替换掉

高收益策略扩散，低收益策略收缩。 Darwin 的影子若隐若现。

于是状态 $k$ 每次只跳一个单位：$k \to k+1$ 或 $k \to k-1$。

这叫出生-死亡链（birth-death chain）。名字很直观，生死之间，一进一退。

转移概率

先算合作者的平均收益。

当前合作者 $k$ 人，背叛者 $N-k$ 人。

合作比例 $x = \frac{k}{N}$，所以：

合作者收益：$\pi_C = 3x = \frac{3k}{N}$
背叛者收益：$\pi_D = 4x + 1 = \frac{4k}{N} + 1$

群体总"适应度"：

Markov-Chain on TouchingFish.top