上篇文章甩出了复制子动力学方程 $\frac{dx}{dt} = x(1-x)(\pi_C - \pi_D)$。没解释从哪来的。
憋着难受。今天补上。
这个方程不是拍脑袋写出来的。它的背后,是"大量个体随机互动"的宏观涌现。说人话:一群人瞎折腾,最后折腾出了规律。
微观随机,宏观确定。这是演化博弈论最迷人之处。
从离散随机过程开始
还是囚徒困境。
群体 $N$ 人,策略只有两种:C 或 D。
记时刻 $t$ 的合作者数量为 $k$。那么合作比例 $x = \frac{k}{N}$。
系统状态?只需要跟踪 $k = 0, 1, 2, \ldots, N$。
这活脱脱一个马尔可夫链(Markov Chain)——下一步长什么样,只看现在,不问过去。
演化规则
规则简单到有点粗暴:
- 随机抽一个人当"复制源"
- 被抽中概率和收益挂钩
- 再随机抽一个人,被替换掉
高收益策略扩散,低收益策略收缩。 Darwin 的影子若隐若现。
于是状态 $k$ 每次只跳一个单位:$k \to k+1$ 或 $k \to k-1$。
这叫出生-死亡链(birth-death chain)。名字很直观,生死之间,一进一退。
转移概率
先算合作者的平均收益。
当前合作者 $k$ 人,背叛者 $N-k$ 人。
合作比例 $x = \frac{k}{N}$,所以:
- 合作者收益:$\pi_C = 3x = \frac{3k}{N}$
- 背叛者收益:$\pi_D = 4x + 1 = \frac{4k}{N} + 1$
群体总"适应度":
$$k\pi_C + (N-k)\pi_D$$向上跳 $P(k \to k+1)$:
一个合作者成功复制,一个背叛者被替代。
合作者被选中的概率 $\frac{k\pi_C}{k\pi_C + (N-k)\pi_D}$,背叛者被选中的概率 $\frac{N-k}{N}$。独立事件,相乘:
$$P(k \to k+1) = \frac{k\pi_C}{k\pi_C + (N-k)\pi_D} \cdot \frac{N-k}{N}$$向下跳 $P(k \to k-1)$:
背叛者复制成功,合作者被替代。
$$P(k \to k-1) = \frac{(N-k)\pi_D}{k\pi_C + (N-k)\pi_D} \cdot \frac{k}{N}$$平均变化率
一次跳跃对应 $x$ 的变化量是 $\frac{1}{N}$。
平均变化:
$$\mathbb{E}[\Delta x] = \frac{1}{N} P(k \to k+1) - \frac{1}{N} P(k \to k-1)$$代入,展开,提取公因子——数学书上的标准操作,没什么好说的。结果:
$$\mathbb{E}[\Delta x] = \frac{k(N-k)}{N^2[k\pi_C + (N-k)\pi_D]} (\pi_C - \pi_D)$$利用 $k = Nx$,$N-k = N(1-x)$:
$$\mathbb{E}[\Delta x] = \frac{x(1-x)(\pi_C - \pi_D)}{N[x\pi_C + (1-x)\pi_D]}$$$N$ 很大时,分母的 $N$ 说了算:
$$\mathbb{E}[\Delta x] \propto x(1-x)(\pi_C - \pi_D)$$缩放时间尺度,离散随机过程流淌成连续时间的微分方程:
$$\frac{dx}{dt} = x(1-x)(\pi_C - \pi_D)$$复制子动力学,堂堂登场。
随机与确定的对应
现在可以搭一个三层架子:
| 层次 | 数学对象 |
|---|---|
| 微观 | 马尔可夫链 / 随机过程 |
| 宏观 | 常微分方程 |
| 无限人口极限 | 复制子动力学 |
复制子动力学是大规模随机过程的均值极限。这句话我抄过很多遍,但每次重读都觉得——它值得被多抄几遍。
固定点呢?
随机模型里,没有真正的静止。总有涨落。
即便 $x$ 逼近 0(全背叛),偶尔也会冒出一个合作者。奇迹也好,偶然也罢。
但 $N$ 足够大时,系统长期窝在 $x=0$ 附近。
ODE 的稳定固定点,在随机过程里对应"概率质量集中的区域"。名字不同,灵魂相似。
纳什均衡在哪?
纳什均衡的意思是:到了某个状态,没有策略在平均意义上更容易扩张。
囚徒困境里,背叛收益始终更高。随机演化最终向全背叛集中——$x=0$。
所以:
- 马尔可夫链长期偏向 $x=0$
- ODE 稳定固定点是 $x=0$
- 纳什均衡也是全背叛
三者在此处握手言欢。
统计物理的老朋友
这套"随机微观 → 确定宏观"的把戏,演化博弈论不是独一份。
分子热运动随机碰撞,最后告诉我们温度。个体随机互动,最后告诉我们策略分布。
$$\text{随机微观} \Rightarrow \text{确定宏观}$$不只是类比。复制子动力学、Wright–Fisher 过程、Moran 过程、Fokker–Planck 方程、Langevin 动力学——它们都是这个框架的变体。
物理学家早就玩剩下的,博弈论学者换个壳子又捡起来。
有意思的是,这种跨学科的结构相似性,往往暗示着某种更深的东西还没被说清楚。
是什么?