BEF研究における因果仮説をめぐる論争

はじめに

a specific SCM is a causal hypothesis. Fitting to data gives you feedback about your hypothesis (and more). It represents a workflow that can lead to stunning advances. It's not a magical box that you put your data into, shake, and watch all causal relationships fall out.
— Don Schoolmaster, 05 Feb 2023

生物多様性-生態系機能（Biodiversity-Ecosystem Function, BEF）研究は、生態学において最も議論の多い領域の一つである。1990年代以降、多くの研究が種多様性と生態系機能の間に正の相関関係があることを示してきた。しかし、この相関が因果関係を意味するのかどうかは、激しい論争の的となってきた。

2020年、Schoolmaster、Zirbel、Cronin（SZC）は Ecology に論文を発表し、グラフィカル因果モデル（Graphical Causal Model）を用いてBEF研究における因果仮説を再検討した。その後、Grace、Loreau、Schmid（GLS）が2021年にSZCのモデルを批判するコメント論文を発表し、SZCは2022年にそれに対する返答を公表した。この学術的論争は、BEF研究の核心的問題だけでなく、因果推論方法論の根本にも触れるものである。

標準的因果モデルの問題点

従来のBEF研究における因果仮説

従来のBEF研究が暗黙に前提とする因果モデルは、以下のように表せる。

E → B → Q → F

ここで、

E (Environment)：環境要因（温度、pH、資源など）
B (Biodiversity)：種多様性（種数、Shannon指数など）
Q (Trait Diversity)：機能形質多様性
F (Ecosystem Function)：生態系機能

このモデルは、環境変動を制御した上で、種多様性が機能形質の変異を引き起こし、それが生態系機能に影響する、と仮定する。SZCはこのモデルを「標準的因果モデル（Standard Causal Model）」と呼ぶ。

SZCによる核心的批判

SZCは、この標準的モデルに根本的な論理的誤りがあると指摘する。問題は、種多様性も機能形質多様性も複合変数（composite variables）であり、種組成（species composition）から算出されるものであるという点にある。

種多様性の計算式は以下の通りである。

$$B = \sum_{i \in K} f_B(s_i), \quad K = \{i \in I | s_i > 0\}_B$$

ここで $s_i$ は種 $i$ の個体数、$K$ は種集合 $I$ のうち個体数がゼロでない部分集合である。

機能形質多様性の計算式は以下の通りである。

$$Q = \sum_{i \in K} f_q(s_i, T_i)$$

ここで $T_i$ は種 $i$ の形質データである。

重要な洞察：機能形質多様性の計算に必要なのは、各種の個体数という種組成データであり、種多様性指数ではない。このことは、標準的モデルにおける B → Q という因果の矢印が誤りであることを意味する。

SZCはさらに、もし機能形質多様性が

$$Q = f_q(B, T)$$

と書けるならば標準的モデルは成立しうるが、実際には既存のあらゆる機能形質多様性の定義は

$$Q = \sum_{i \in K} f_q(s_i, T_i)$$

の形をとることを指摘する。これは、機能形質多様性の計算に必要なのが各種の個体数であって、種多様性指数ではないことを示している。

SZC因果モデル

修正された因果グラフ

以上の分析に基づき、SZCは修正された因果モデルを提案した。テキストで表すと以下のようになる。

        E
       /|\
      / | \
     v  v  v
    C   T  |
    |\  |  |
    | \ |  |
    v  vv  v
    B   Q→→F

より明確に、各変数間の因果関係は次のように記述できる。

E → C：環境が種組成に影響する
E → T：環境が機能形質分布に影響する
E → F：環境が生態系機能に直接影響する
C → B：種組成が群集組成（種数など）を決定する
C → Q：種組成が機能形質組成に影響する
T → Q：機能形質分布が機能形質組成を決定する
Q → F：機能形質組成が生態系機能に影響する

ここで、

C (Species Composition)：種組成、すなわち各種の個体数の集合 $\{s_1, ..., s_n\}$
T (Functional Traits)：機能形質分布、すなわち各種の形質データ $\{\{t_{11}, ..., t_{1n}\}, ..., \{t_{k1}, ..., t_{kn}\}\}$
B (Community Composites)：群集組成（種数、総バイオマス、Shannon多様性など）
Q (Functional Trait Composites)：機能形質組成（群集加重平均、機能多様性など）

核心的主張

SZCは修正された因果モデルから、三つの核心的主張を導く。

種多様性は生態系機能の直接的原因ではない：種多様性は種組成を通じて計算されるものであり、生態系機能は機能形質によって決定される。因果グラフにおいて、BからFへの直接的・間接的パスは存在しない。
BEF相関は非因果的関連である：種多様性と生態系機能の相関は、両者がともに種組成に依存することによる。因果推論の言葉で言えば、これは「交絡（confounding）」の問題である。
種同一性効果はモデルの誤設定に由来する：機能形質モデルが不完全な場合、有意な種同一性効果やBEF相関が現れる。これらの効果は、欠落している機能形質を特定するための診断ツールとして利用できる。

因果効果の推定

SZCはバックドア基準（Backdoor Criterion）を用いて、生物多様性の生態系機能に対する因果効果を導出した。バックドア基準の公式は以下の通りである。

$$P(Y=y|do(X=x)) = \int_z P(Y=y|X=x, Z=z)P(Z=z) \, dz$$

ここで $do(X=x)$ はXへの介入操作を表し、Zはバックドア基準を満たす変数集合である。

BEF問題に適用すると、SZCは次式を導出した。

$$P(F=f|do(B=b)) = \int_{q,e} P(F=f|B=b,Q=q,E=e)P(Q=q|C=c,T=t)P(E=e) \, de \, dq$$

BからFへのすべてのパスはQとEを経由するため、

$$P(F=f|B=b,Q=q,E=e) = P(F=f|Q=q,E=e)$$

これを代入すると、

$$P(F=f|do(B=b)) = P(F=f)$$

が得られる。これは、生物多様性の生態系機能に対する因果効果がゼロであることを意味する。

条件付き独立性の表明

因果グラフは一連の条件付き独立性の表明を符号化している。SZCは八つの重要な条件付き独立性の表明を列挙した。

$B \perp F \mid \{Q, E\}$：機能形質組成と環境を与えたとき、生物多様性と生態系機能は独立である
$C \perp F \mid \{Q, E\}$：機能形質組成と環境を与えたとき、種組成と生態系機能は独立である
$T \perp F \mid \{Q, E\}$：機能形質組成と環境を与えたとき、機能形質分布と生態系機能は独立である
$E \perp Q \mid \{C, T\}$：種組成と機能形質分布を与えたとき、環境と機能形質組成は独立である
$E \perp B \mid C$：種組成を与えたとき、環境と生物多様性は独立である
$B \perp T \mid C$：種組成を与えたとき、生物多様性と機能形質分布は独立である
$B \perp Q \mid C$：種組成を与えたとき、生物多様性と機能形質組成は独立である
$C \perp T \mid E$：環境を与えたとき、種組成と機能形質分布は独立である

これらの条件付き独立性の表明は、モデルが正しく設定されているかどうかを検証するために用いることができる。検証に失敗した場合、モデルに誤設定があることを示す。

シミュレーションによる検証

SZCはシミュレーションによって自らの主張を検証した。生態系機能は以下のようにシミュレートされた。

$$F = 2 \cdot CWM_{T1} + CWV_{T1} + E + \epsilon$$

ここで $CWM_{T1}$ は形質T1の群集加重平均、$CWV_{T1}$ は形質T1の群集加重分散、$E$ は環境勾配、$\epsilon$ は誤差項である。

シミュレーション結果は以下のことを示した。

モデルが正しく設定されている場合、種の個体数や生物多様性変数を追加しても有意な効果は生じない
モデルに環境変数Eが欠落している場合、種同一性効果が現れる
モデルに $CWM_{T1}$ が欠落している場合、種同一性効果とBEF相関が現れる
モデルに $CWV_{T1}$ が欠落している場合、BEF相関が現れる

これはSZCの核心的主張——種同一性効果とBEF相関はモデルの誤設定の結果である——を支持するものである。

Graceらによる批判

GLSは2021年のコメント論文において、SZCモデルに対して四つの主要な批判を提示した。

批判1：SZCモデルは有効な因果グラフではない

GLSは、SZCが種組成から種多様性への矢印（C → B）を因果関係として表現しているのは誤りであると主張する。彼らは次のような類推を用いて説明する。

品物で満たされた倉庫があり、倉庫内の品物の総数と種類別の数量を正確かつ即時に反映する帳簿を手にしていると想像してほしい。倉庫に10種類の品物がある場合、「何種類の品物があるか」という情報は倉庫と帳簿の両方に同時に存在する。倉庫が「10種類あること」を「引き起こす」のではなく、帳簿は品物集合の量的属性を反映しているにすぎない。

GLSは、このような計算関係を表すには「→」ではなく「=」を用いるべきだと主張する。彼らは次のように述べる。

Because biodiversity is a calculated variable, the representation (Fig. 1C) is not a valid causal diagram.

GLSはまた、SZCのグラフでは種数が二度表現されている——一度は群集レベルの変数Rとして、もう一度は標本レベルで個体数がゼロでない要素の数として——と指摘する。この情報の重複が誤った結論を導いたのだ、と。

批判2：SZCは無効果仮説を前提としている

GLSは、SZCモデルにはBからFへの因果パスが存在しないため、モデルそれ自体が「生物多様性は生態系機能に因果効果を持たない」という仮説を符号化していると指摘する。SZCの分析結果はこの仮説の演繹的帰結にすぎず、仮説の検証ではない、と。

SZC自身も次のように認めている。

Using the DAG in Fig. 1C, we will derive the statistical model required to measure a biodiversity effect... Fig. 1C makes clear that the value of this effect is zero [as] there are no causal arrows emitted from the biodiversity node.

GLSは、このことはSZCの分析が自らのモデルの正しさを検証できないことを示している、と考える。

批判3：BEF実験が示すのは条件付き因果である

GLSは、BEF実験において異なる混合物（mixture）間のばらつきがあるからといって、平均因果効果が推定できないわけではないと主張する。これは因果の不在ではなく、条件付き因果（conditional causation）の例にすぎない、と。

GLSはVanderWeele (2015)を引用し、平均因果効果（ACE）が共変量に依存する場合（これは生物システムでは典型的である）、それは条件付き因果の例であると述べる。条件付き因果も因果であり、それを理由にR → Fの関係を擬似相関と断じることはできない。

批判4：「真の原因」論証は誤謬である

GLSはSZCの論証を「半面真理（half-truth）」の誤謬であると批判する。SZCは、種組成が生態系機能の変異に寄与するならば、種数は寄与しえない、と暗に示唆している。

GLSは、この論証の問題点を次のように指摘する。因果連鎖におけるすべての変数は原因であり、ただ、あるものはより遠位（distal）、あるものはより近位（proximal）であるにすぎない。もし種数を操作することで形質の数が変化し、それによって機能が変化するならば、種数は因果連鎖における一つの原因である。

GLSは、より適切な結論は次のようなものであるべきだと述べる。

The evidence suggests that species diversity influences community function, and that the characteristics of the individual species in a community contribute to variations in function.

Schoolmasterらによる反論

SZCは2022年の返答論文において、GLSの批判に逐一応答した。

決定論的変数について

SZCは、GLSが因果グラフにおいて決定論的変数に向かう矢印を禁じているのは、因果推論分野の確立された実践と矛盾すると指摘する。彼らは複数の文献を引用している。

Pearl (2016)：Lord's Paradoxの因果モデルでは、体重変化（Weight Gain, Y）は初期体重と最終体重から計算される決定論的変数である。
Hernán & Cole (2009)：BMIの因果モデルでは、BMIは体重と身長から計算される決定論的変数である。
Flanders et al. (2020)：認知機能変化の因果モデルでは、変化量はベースラインと追跡時点の測定値から計算される決定論的変数である。

Pearl and Mackenzie (2018:214)は明確に次のように述べている。

Note that Y is related to $W_I$ and $W_F$ in a purely mathematical, deterministic way: $Y = W_F - W_I$.

さらに重要なことに、SZCは帰納的因果アルゴリズム（IC-Algorithm）を適用し、データ生成過程に決定論的関係が含まれる場合、アルゴリズムは決定論的変数に向かう因果の矢印を正しく返すことを証明した。IC-AlgorithmはPearl (2009)に記述された標準的アルゴリズムであり、条件付き独立性の関係からデータに基づいて因果構造を推論するものである。

因果的順序について

GLSの第一の推論は、原因と応答の間には「有限の時間間隔」があり、矢印は「過去のある時点から現在への情報の移動」を表す、というものである。

SZCは、因果的順序問題（Causal Ordering Problem, COP）が人工知能および因果推論分野における形式的な理論問題であると指摘する。Pearlは、変数を記述する一連の対称的な方程式が与えられたとき、変数の因果的順序を決定するための基準を記述している。

SZCは付録S1においてこの基準を適用し、種組成が種数の論理的前提であり、種数は組成が確定するまでは知りえないことを示した。群集の種数を変えようとするならば、その種組成を変えなければならない。したがって、SZCモデルは因果的順序の原則に違反しない。

SZCはさらに、もしGLSの主張——有向矢印は「原因と応答の間の有限の時間間隔」を表さなければならない——が正しいとすれば、標準的因果モデルもGLSの代替モデルも無効になる、と指摘する。種数と形質多様性の間には時間間隔が存在しないからである。

非対称性について

GLSの第二の推論は、「矢印の先端にある量を、矢印の基部にある量に影響を与えずに強制的に変化させることができる」というものである。

SZCは、この記述が因果推論における非対称性の標準的定義を誤解していると指摘する。GLSのテストは次のようなものである。

If we were to manipulate the variable at the tip of the arrow (e.g., Y), would there be a potential for a response by the variable at the base of the arrow (X)?

しかし、正しい非対称性の定義は次のとおりである。関係が因果的であるならば、「Xへの介入はYに影響するが、Yへの介入はXに影響しない」。

決定的な違いは、GLSの定義がYを直接操作できることを要求しているのに対し（これは計算変数にとって不可能である）、標準的定義はXの操作がYに与える影響のみを問題としており、Yを直接操作できるかどうかとは無関係である、という点にある。

数学的に言えば、$Y = f(X)$ を因果モデル化するということは、仮想的な介入 $X = x_0$ が与えられたとき（XでもYでもないすべての変数を一定に保つ）、Yの値は $f(x_0)$ で与えられる、ということを意味する。非対称性とは、この関係が「Yを制御したときにX（または他の任意の変数）がどう振る舞うかについては、いかなる言明も行わない」（Pearl 2009a:160）ということを意味する。

GLSの符号化モデルはSZCモデルに帰着する

SZCはGLSの付録にあるシミュレーションコードを検証し、決定的な問題を発見した。GLSの符号化された因果モデルは、実際にはSZCモデルに帰着するのであり、彼らが口頭で擁護する標準的モデルではないのである。

GLSのコードでは、

R（種数）は $Q_d$（形質変異）の計算に用いられていない
$Q_d$ はF（生態系機能）の計算に用いられていない

これは標準的モデル $R \rightarrow Q_d \rightarrow F$ の仮定に直接反する。

SZCは付録S3において、GLSのデータ生成過程がモデル $T \rightarrow Q \rightarrow F$ と同等であることを証明した。ここでTはシステムレベルの形質ベクトルである。これはまさにSZCモデルの一事例である。

BEF実験の解釈について

SZCは、BEF実験における介入の対象は種組成（C）であって、種数（R）ではないと強調する。実験処理は研究者の表明する意図によってではなく、実際に実行された介入によって定義されるべきである。

An experimental treatment is not defined by what an experimenter says it is or intends it to be, but by the specific intervention the experimenter performs.

訳注：実験処理は、実験者がそうだと述べることや、そう意図することによって定義されるのではなく、実験者が実際に行う特定の介入によって定義される。

実験処理群は、同じ介入を受けた実験単位の集合として定義される。BEF実験にとって、介入とは群集構造への操作——どの種を含め、どの種を除外するかの選択——である。同じ種の含有・除外パターンを持つ各プロットは、同一の処理群に属する。

SZCは次のような類推を用いて説明する。生態学者はしばしば、異なる量や種類の炭素源をプロットに添加することで、異なるレベルの栄養ストレスを引き起こす。これらの実験における処理は、添加された炭素源の量と種類（すなわち介入）によって定義されるのであり、達成された栄養ストレスレベルによってではない。

したがって、平均因果効果を正しく計算するには、同じ組成の反復混合物にわたって平均を取る必要があり、異なる混合物をまたいで平均を取ってはならない。これに違反することは、「処理の複数バージョンなし仮定（no-multiple-versions-of-treatment assumption）」の違反と呼ばれる。

訳注：「no-multiple-versions-of-treatment assumption」は、同じ処理ラベルを持つすべての単位が実際に同一の処理を受けているという仮定である。

種数は隠れた原因ではない

GLSは、SZCモデルにおいて種数の情報が「密かに使用されている」と主張した。SZCは付録S3において、SZC因果モデルが、すべての種数情報を除去した場合でも、GLSの符号化因果モデルが生成する値を正確に複製できることを証明した。

SZCは極端な例を示している。種内個体に機能形質変異が存在する場合、誰かが形質状態iを持つ個体数または在・不在でベクトルCの要素 $c_i$ を埋めたとしても、SZCモデルから得られる生態系機能の推定値は変化しない。これは、SZC因果モデルにおいて種数が生態系機能に対して因果的に無関係であることの証明である。

最後に

種多様性の定義がもたらす影響

筆者がノートに記したように、種多様性の定義は研究に重要な影響を及ぼす。

群集組成要素と等価な定義：この定義のもとでは、種多様性研究は実質的に群集組成を研究していることになる。
因果効果推定の因子としての定義（ランダム化）：Tilman et al. (2014)のアプローチのように、群集組成を操作することで特定の生物多様性を実現する方法である。

生物多様性の操作とは、実質的に群集構造への操作である。種組成要素を操作することで特定の生物多様性を実現する——すなわち、異なるCを作り出すことで同じBに合わせる——この実験方法は、生物多様性を直接操作することとは異なる。同じ集合Cに対して異なるBを作り出す操作ではないからである。

これは重要な帰結をもたらす。群集組成要素が生物多様性Bと形質組成Qの両方を駆動するため、群集組成要素Cを操作することで生じる機能形質の変異は、生物多様性と生態系機能の潜在的な関連に影響しない。したがって、これらの実験は生物多様性の効果を独立に評価することはできない。

複合変数の因果的地位

SZCの核心的貢献は、複合変数の因果的地位を明確にしたことにある。環境（E）と生態系機能（F）は直接観測可能な変数であるが、種多様性（B）と機能形質多様性（Q）は観測変数から計算によって得られるものである。

このことは以下を意味する。

環境が種多様性や形質多様性に及ぼす因果効果は、種の個体数や形質データへの効果によって媒介される
種多様性と形質多様性は、その原因変数の数量化とみなすことができる

BEF研究において、多様性は生態系機能の駆動要因である。多様性は混合物の組成の複雑さを測定するために用いられ、通常は種組成の分布（種多様性）または機能形質多様性（形質多様性）を測定する。

実践的意義

SZCの分析はBEF研究に対して重要な実践的意義を持つ。

モデル誤設定の診断：種同一性効果とBEF相関は、モデル誤設定の診断ツールとして利用できる。有意な種同一性効果やBEF相関が見られる場合、正しい機能形質組成または環境交絡因子がモデルに欠落していることを示す。
研究デザインの指針：研究は「多様性効果」の追求ではなく、正しい機能形質組成の同定に焦点を当てるべきである。機能形質組成は、誤った機能形質セットに基づいているか、正しい機能形質セットの誤った数学的組み合わせである可能性がある。
実験結果の再解釈：BEF実験の結果は、種数を操作した効果としてではなく、種組成を操作した効果として理解されるべきである。

この論争についての観察

この論争の核心的分岐点は、因果モデルにおける「計算関係」の地位をどのように理解するかにある。GLSは計算関係は因果関係ではないため、因果グラフにおいて矢印で表現することはできないと考える。SZCは、計算関係も因果グラフ内で表現可能であり、それは因果推論分野における標準的実践であると考える。

方法論的観点からは、SZCの論証の方が説得力がある。

Pearlをはじめとする権威ある文献を引用し、決定論的変数が因果モデルにおいて使用されることが標準的実践であることを証明している
IC-Algorithmを適用し、アルゴリズムが決定論的変数に向かう因果の矢印を正しく識別できることを証明している
GLSの符号化モデルが実際にはSZCモデルに帰着することを発見しており、これはGLSの批判の力を弱める

しかし、GLSが提起した「条件付き因果」の視点も真剣に受け止める価値がある。SZCの枠組みのもとでも、BEF実験はある種の因果効果を推定しうる——ただし、それは同じ組成の反復混合物にわたる平均であって、異なる混合物をまたいだ平均ではない。

結論

この学術的論争は、因果推論手法の生態学における応用価値を示している。SZCの仕事は以下のことを改めて認識させる。

因果モデルは仮説である：構造的因果モデルが表すのは研究者の因果仮説であって、データから自動的に発見される真理ではない。Schoolmasterがツイッターで述べたように、因果モデルは魔法の箱ではない。
変数の定義は重要である：複合変数の因果的地位は慎重に検討される必要があり、計算関係を因果関係と単純にみなすことはできない。種多様性は種組成から計算され、機能形質多様性も種組成から計算される。このことは、両者の間に標準的モデルが仮定するような因果連鎖は存在しないことを意味する。
実験デザインには因果的な明晰さが必要である：実験介入の定義は、研究者の意図ではなく実際の操作に基づくべきである。BEF実験が操作しているのは種組成であり、種数ではない。
条件付き独立性の表明は診断ツールである：因果グラフが符号化する条件付き独立性の表明は、モデルが正しく設定されているかどうかを検証するために使用できる。種同一性効果とBEF相関は、モデル誤設定のシグナルである。

この論争はまだ終わっていない。GLSが提起した条件付き因果の観点や、種間相互作用の重要性といった問題は、さらなる検討に値する。しかし、SZCの仕事はすでにBEF研究に対してより厳密な因果的枠組みを提供しており、これは生物多様性と生態系機能の関係を理解する上で重要な意義を持つ。

参考文献

Schoolmaster, D. R. Jr., Zirbel, C. R., & Cronin, J. P. (2020). A graphical causal model for resolving species identity effects and biodiversity–ecosystem function correlations. Ecology, 101(8), e03070.
Grace, J. B., Loreau, M., & Schmid, B. (2021). A graphical causal model for resolving species identity effects and biodiversity–ecosystem function correlations: comment. Ecology, e03378.
Schoolmaster, D. R. Jr., Zirbel, C. R., & Cronin, J. P. (2022). A graphical causal model for resolving species identity effects and biodiversity–ecosystem function correlations: Reply. Ecology, 103(2), e03593.
Pearl, J. (2009). Causality: Models, Reasoning, and Inference (2nd ed.). Cambridge University Press.
Pearl, J., & Mackenzie, D. (2018). The Book of Why: The New Science of Cause and Effect. Basic Books.
Hernán, M. A., & Cole, S. R. (2009). Invited Commentary: Causal diagrams and measurement bias. American Journal of Epidemiology, 170(8), 959–964.
VanderWeele, T. J. (2015). Explanation in Causal Inference: Methods for Mediation and Interaction. Oxford University Press.