酵母はインベルターゼを細胞外に分泌し、スクロースを消化する。消化された糖は誰でも利用できる——ここが面白い。ある細胞は「ただ乗り」を選べる。隣の細胞が分泌した酵素を盗み使い、自分では分泌しないのだ。研究者たちは、機能的な SUC2 遺伝子を持つ酵母を「協力者」、SUC2 遺伝子を欠失させた酵母を「裏切り者」と呼び、両者を競合させた。
結果は直感に反するものだった。
- まばらな集団(低い社会的密度)では、裏切り者の適応度はわずか 0.87——協力者より劣る
- 密な集団(高い社会的密度)では、裏切り者の適応度はなんと 1.19——協力者を上回る
なぜか。社会的密度が高いほど、協力者は他の協力者と出会いやすい。皆が酵素を分泌すれば共有資源のプールは大きくなり、各個体の利益も増す。そこに裏切り者が紛れ込めば、一方的に共有の成果を享受しながらコストを払わないため、利益は爆発的に跳ね上がる。
密度が極めて高くなると、裏切り者はほぼ常に搾取対象を見つけられ、自分で分泌する以上の量を盗み取る。協力者はむしろ足を引っ張られる。
これは私の直感に完璧に合致する。だが、自分でもう一度やってみたかった——論文の結論を検証するためではなく、この過程を自らの手で「見る」ために。方程式を格子に書き込み、数字が走り出すのを眺めたかったのだ。
モデル設定
$n \times n$ の格子。個体群密度(population density)が各セルにエージェントを配置する確率を制御する。エージェントは二つの戦略をとる:C(協力、酵素を分泌する)と D(裏切り、分泌しない)。
二者が出会うたびに標準的な囚人のジレンマをプレイする。利得行列は:
$$ \begin{pmatrix} R=3 & S=0 \\ T=5 & P=1 \end{pmatrix} $$R は協力-協力の報酬、T は裏切りの誘惑、S は裏切られた側の利得、P は相互裏切りの罰。古典的な設定に従い、$T > R > P > S$、かつ $2R > T + S$(互恵的協力は繰り返される裏切りより優れている)。
各ステップ:
- エージェントはフォン・ノイマン近傍(上下左右の四セル)で隣人を探す
- 二人で一回のゲームを行う
- このステップの利得 $\pi$ を比較する
- 利得差に比例する確率で隣人の戦略を模倣する
- ランダムな方向に一格子単位で移動する
見るのは当期利得のみ。履歴はなく、計画もない。
理論的予測
レプリケータダイナミクス(Replicator Dynamics)は平均場における以下の方程式を与える:
$$\frac{dx}{dt} = x(1-x)[\pi_C - \pi_D]$$$x$ は協力者の割合、$\pi_C$ と $\pi_D$ は各戦略の期待される単ステップ利得である。
利得は出会いの確率に依存する。平均場近似では、協力者が協力者に出会う確率は $x$、裏切り者に出会う確率は $1-x$。裏切り者についてはその逆:
$$\pi_C = x \cdot R + (1-x) \cdot S$$$$\pi_D = x \cdot T + (1-x) \cdot P$$代入すると:
$$\pi_C - \pi_D = x(R - T) + (1-x)(S - P)$$具体的な数値 $R=3, S=0, T=5, P=1$ を用いれば:
$$\pi_C - \pi_D = x(3-5) + (1-x)(0-1) = -2x -1 + x = -1 - x$$$\pi_C - \pi_D < 0$ が常に成り立つ——$x$ がどれほど大きくとも、協力者の当期利得は常に裏切り者を下回る。
これは $\frac{dx}{dt} = x(1-x)(-1-x) < 0$ を意味する。協力者の割合は一方的に減衰し、最終的には $x=0$——完全な裏切り——へと向かう。
平均場近似とは「完全混合」の世界である。全員が全員と等確率で出会う。しかし私の格子はそうではない。空間構造が協力を支える可能性がある。
シミュレーションと結果
以下の実験は $50 \times 50$ の格子上で実行し、各ステップを同期更新、ゲームのラウンド数は系が安定するまで十分に取った。
実験一:密度を固定し、進化の軌跡を見る
個体群密度 $\rho = 0.3$ に設定し、初期協力者割合 $x_0$ を変化させる。
直感的な推測:$x_0$ が高いほど協力者は長く持ちこたえ、低い $x_0$ では即座に崩壊する。ただし格子構造により、局所的な高協力領域が初期段階ではしばらく耐えるかもしれない。
実際に走らせてみた感触では、協力者の「生存可能な窓」は非常に狭い。空間構造が局所的な集団を維持し、短い防御期間をもたらした後、D 戦略は結局境界から浸透してくる——協力者のクラスターは常に外周から侵食されるのだ。
実験二:初期割合を固定し、密度効果を見る
$x_0 = 0.5$ に設定し、個体群密度 $\rho \in [0.02, 1.0]$ を変化させる。実行後、$\pi_C$ と $\pi_D$ の平均値の差を計算する。

縦軸は $P_C - P_D$、協力者の利得から裏切り者の利得を引いた値である。全て正——すなわち、あらゆる密度において、協力者の平均利得は裏切り者を上回っている。純粋にランダムな相互作用を前提とする平均場方程式では決して現れえない結果だ。空間構造が C 戦略に防御帯を描き出している。
しかしトレンドは一目瞭然である。低密度では $P_C - P_D$ は 0.05 近くあるが、高密度では約 0.002 まで落ち込む。25 倍の差だ。
密度 2% では、格子はまばらで、エージェントはほとんどの時間、孤立している。孤立したエージェントにはペアを組める隣人がいない——そのステップではゲームも利得変動もなく、現在の戦略を維持するのは損にならない。協力者には、たまに同類と出会って互恵するチャンスもある。裏切り者も同じだけ孤立するが、孤立状態では何も起こらず、裏切りのうまみはない。
密度が高いほど、出会いは頻繁になる。出会いのたびに、C が D に搾取される機会が生まれる。C-C の互恵が増えたとしても、両者がコストを払って共有資源を維持しているに過ぎない——そのすぐ隣で、何も貢献しない D が旨みを吸っているのだ。
Greig の酵母実験は同じ方向性を示している。密度が高いほど、裏切りが有利になる。ただし彼らは裏切り者の視点から——高密度では裏切り者の適応度が 1 を超える——見ていた。私のこの図は協力者の視点から——優位はまだあるが、絶えず縮小している——を見ている。
興味深いことに、このパラメータ設定では優位がゼロになる臨界密度はついに現れなかった。$P_C - P_D$ はゼロに漸近するが、ゼロには触れていない。より極端な利得設定(たとえば T をもっと引き上げる)では、協力者の優位が完全に消し去られるかもしれない。
(あるいは、フォン・ノイマン近傍をムーア近傍に変えれば——八人の隣人は四人よりずっと D に晒されやすい。まだ試してはいない。)
あとがき
Greig の論文で気づいたことがある。囚人のジレンマの「ジレンマ」とは、解がないことではなく、解が構造に依存することにあるのだ。同じゲームのルールが、まばらな社会的ネットワークと密な社会的ネットワークとでは、正反対の方向の結果をもたらす。
レプリケータダイナミクスは基準となる予測を提供する——完全混合かつ当期利得のみを見た場合の進化の方向性を。しかし、現実の系が持つ空間構造——寒天プレート上の隣人半径であれ、格子上のフォン・ノイマン近傍であれ——がひとたび組み込まれれば、予測は変わる。
ABM の価値はまさにここにある。構造を組み込み、何が創発するかを見る。
実験一と実験二を走らせて得た感触は、空間構造は一種の緩衝材のようなものだということだ。方向を逆転させるのではなく、速度を遅らせる。協力者は結局 D に敗れる運命にあるが、格子上では平均場方程式の予測よりもゆっくりと敗れていく。
しかし、書き終えたあと、考えれば考えるほど、もう一段足りないように思えてきた。
Greig の実験はスクロース寒天プレート上で行われた。スクロースが唯一の炭素源である。まばらなプレートでは、糖が多く細胞が少ない——各細胞の周囲のスクロースはほぼ無限に等しい。密なプレートでは、細胞がひしめき合い、糖はすぐに消費し尽くされる——自分の周囲の糖は、隣人がどれだけ酵素を分泌したかに依存する。
私の ABM は利得行列を不動のものとして前提している。$T=5, R=3, P=1, S=0$——密度がいくつであろうと、一回のゲームの利得は決して変わらない。しかし酵母のインベルターゼは、環境から独立して動作するゲームマシンではない。スクロースを消化するのだ。糖が減れば、消化量も減る。消化量は、自分が酵素を分泌するかどうかだけでなく、スクロースがどれだけ残っているかにも依存する。
スクロースが底をついたら——一群の細胞がひしめき合い、誰も酵素を分泌しない——相互裏切りの利得は $P=1$ ではなく、マイナスかもしれない。何も消化できない。細胞は飢える。むしろ協力-協力は酵素のコストを払うとはいえ、少なくともわずかな糖は分け合える。
つまり、Greig の酵母は、常に囚人のジレンマをプレイしているとは限らないのだ。
糖が潤沢な高密度領域では、裏切り者は協力者を搾取して肥え太る——標準的な PD だ。しかし糖が枯渇した縁辺——まばらなコロニーが局所的なスクロースを消費し尽くしたあと——では、ゲームの土台は囚人のジレンマから別の何かへと滑り落ちていく。相互裏切りはもはや低利得ではなく、負の利得である。協力の相対的な不利は、突如として消え去る。
戦略が資源を消費し、資源が行列を書き換え、行列が戦略を再形成する。閉ループがひとたび形成されれば、囚人のジレンマの「ジレンマ」は、境界条件を固定された最適化問題ではない——その境界条件自体が変数なのだ。
これはまだ推測に過ぎない。検証するには、酵素動力学を ABM に組み込む必要がある——糖の濃度を局所変数とし、利得を糖濃度からリアルタイムで計算する。「密度が利得行列を決める」のではなく、「密度が資源消費を通じて間接的に利得行列を変化させる」のだ。
一つの方向性として。
参考文献
Greig, D., & Travisano, M. (2004). The Prisoner's Dilemma and polymorphism in yeast SUC genes. Proceedings of the Royal Society of London. Series B: Biological Sciences, 271, S25 - S26.