随机搭起的那座桥 | TouchingFish.top

上篇文章甩出了复制子动力学方程 $\frac{dx}{dt} = x(1-x)(\pi_C - \pi_D)$。没解释从哪来的。

憋着难受。今天补上。

这个方程不是拍脑袋写出来的。它的背后，是"大量个体随机互动"的宏观涌现。说人话：一群人瞎折腾，最后折腾出了规律。

微观随机，宏观确定。这是演化博弈论最迷人之处。

从离散随机过程开始

还是囚徒困境。

群体 $N$ 人，策略只有两种：C 或 D。

记时刻 $t$ 的合作者数量为 $k$。那么合作比例 $x = \frac{k}{N}$。

系统状态？只需要跟踪 $k = 0, 1, 2, \ldots, N$。

这活脱脱一个马尔可夫链（Markov Chain）——下一步长什么样，只看现在，不问过去。

演化规则

规则简单到有点粗暴：

随机抽一个人当"复制源"
被抽中概率和收益挂钩
再随机抽一个人，被替换掉

高收益策略扩散，低收益策略收缩。 Darwin 的影子若隐若现。

于是状态 $k$ 每次只跳一个单位：$k \to k+1$ 或 $k \to k-1$。

这叫出生-死亡链（birth-death chain）。名字很直观，生死之间，一进一退。

转移概率

先算合作者的平均收益。

当前合作者 $k$ 人，背叛者 $N-k$ 人。

合作比例 $x = \frac{k}{N}$，所以：

合作者收益：$\pi_C = 3x = \frac{3k}{N}$
背叛者收益：$\pi_D = 4x + 1 = \frac{4k}{N} + 1$

群体总"适应度"：

$$k\pi_C + (N-k)\pi_D$$

向上跳 $P(k \to k+1)$：

一个合作者成功复制，一个背叛者被替代。

合作者被选中的概率 $\frac{k\pi_C}{k\pi_C + (N-k)\pi_D}$，背叛者被选中的概率 $\frac{N-k}{N}$。独立事件，相乘：

$$P(k \to k+1) = \frac{k\pi_C}{k\pi_C + (N-k)\pi_D} \cdot \frac{N-k}{N}$$

向下跳 $P(k \to k-1)$：

背叛者复制成功，合作者被替代。

$$P(k \to k-1) = \frac{(N-k)\pi_D}{k\pi_C + (N-k)\pi_D} \cdot \frac{k}{N}$$

平均变化率

一次跳跃对应 $x$ 的变化量是 $\frac{1}{N}$。

平均变化：

$$\mathbb{E}[\Delta x] = \frac{1}{N} P(k \to k+1) - \frac{1}{N} P(k \to k-1)$$

代入，展开，提取公因子——数学书上的标准操作，没什么好说的。结果：

$$\mathbb{E}[\Delta x] = \frac{k(N-k)}{N^2[k\pi_C + (N-k)\pi_D]} (\pi_C - \pi_D)$$

利用 $k = Nx$，$N-k = N(1-x)$：

$$\mathbb{E}[\Delta x] = \frac{x(1-x)(\pi_C - \pi_D)}{N[x\pi_C + (1-x)\pi_D]}$$

$N$ 很大时，分母的 $N$ 说了算：

$$\mathbb{E}[\Delta x] \propto x(1-x)(\pi_C - \pi_D)$$

缩放时间尺度，离散随机过程流淌成连续时间的微分方程：

$$\frac{dx}{dt} = x(1-x)(\pi_C - \pi_D)$$

复制子动力学，堂堂登场。

随机与确定的对应

现在可以搭一个三层架子：

层次	数学对象
微观	马尔可夫链 / 随机过程
宏观	常微分方程
无限人口极限	复制子动力学

复制子动力学是大规模随机过程的均值极限。这句话我抄过很多遍，但每次重读都觉得——它值得被多抄几遍。

固定点呢？

随机模型里，没有真正的静止。总有涨落。

即便 $x$ 逼近 0（全背叛），偶尔也会冒出一个合作者。奇迹也好，偶然也罢。

但 $N$ 足够大时，系统长期窝在 $x=0$ 附近。

ODE 的稳定固定点，在随机过程里对应"概率质量集中的区域"。名字不同，灵魂相似。

纳什均衡在哪？

纳什均衡的意思是：到了某个状态，没有策略在平均意义上更容易扩张。

囚徒困境里，背叛收益始终更高。随机演化最终向全背叛集中——$x=0$。

所以：

马尔可夫链长期偏向 $x=0$
ODE 稳定固定点是 $x=0$
纳什均衡也是全背叛

三者在此处握手言欢。

统计物理的老朋友

这套"随机微观 → 确定宏观"的把戏，演化博弈论不是独一份。

分子热运动随机碰撞，最后告诉我们温度。个体随机互动，最后告诉我们策略分布。

$$\text{随机微观} \Rightarrow \text{确定宏观}$$

不只是类比。复制子动力学、Wright–Fisher 过程、Moran 过程、Fokker–Planck 方程、Langevin 动力学——它们都是这个框架的变体。

物理学家早就玩剩下的，博弈论学者换个壳子又捡起来。

有意思的是，这种跨学科的结构相似性，往往暗示着某种更深的东西还没被说清楚。

是什么？