局部平均处理效应:精准刻画的智慧

局部平均处理效应(Local Average Treatment Effect, LATE)是解决工具变量(instrumental variables, IV)分析中“异质性”问题的重要概念,尤其在处理效应并非全体受试者均一致之时,LATE 能准确捕捉那些响应工具变量之人群的因果效应。其所估计者,并非总体平均处理效应,而是仅针对那些遵从工具变量之个体(即“遵从者”)的平均处理效应。

样本的分层

如果将医生的处方作为工具变量 $Z$,是否遵从处方服用药物为 $T$,则可以将样本分为“遵从者”(Compliers)与“非遵从者”(Defiers)组,并对这两组个体之潜在结果进行比较。

$$ \begin{aligned} T(1) \triangleq T(Z=1)\\\ T(0) \triangleq T(Z=0) \end{aligned} $$

来表示对 $Z$ 进行干预时获得的处理 $T$,所有样本可以分为以下 4 种类型:

  1. Compliers: $T(1)=1$ and $T(0)=0$
  2. Always-takers: $T(1)=1$ and $T(0)=1$
  3. Never-takers: $T(1)=0$ and $T(0)=0$
  4. Defiers: $T(1)=0$ and $T(0)=1$

其中,遵从者与非遵从者是否接受处理完全取决于工具变量。

而 Always-takers 和 Never-takers 是否接受处理则与工具变量无关。例如,根据自己意愿,而不按处方用药者。

后者之因果图中不存在 $Z \to T$ 的边,故对 Always-takers 和 Never-takers 而言,$Z$ 对 $Y$ 之因果效应为 $0$。

根据是否被要求接受处理($Z=1 \quad \text{or} \quad Z=0$),以及是否接受处理($T=1 \quad \text{or} \quad T=0$) 进行分层时,共有4种组合:

因此,我们无法确切断定某一个体究竟归属于何种类别。。

识别局部平均处理效应

局部平均处理效应(LATE)表示为:

$$ \Bbb{E}[Y(T=1)-Y(T=0)|T(Z=1)=1,T(Z=0)=0] $$

根据单调性假设(Monotonicity Assumption),被要求接受处理的单元,接受处理的可能性更高(至少与不被要求接受处理的相同)

$$ \forall i \quad T_i(Z=1) \geq T_i(Z=0) $$

易发现,只有 Defiers 不满足单调性假设。换言之,上式相当于假设不存在 Defiers。

公式推导

首先,明确我们感兴趣的为处理 $T$ 对结局 $Y$ 之因果效应。

考虑工具变量 $Z$ 对 $Y$ 的因果效应,根据上节中的 4 种分层对其加权平均

$$ \begin{aligned} \Bbb{E}[Y(Z&=1)-Y(Z=0)]\\\ =&\Bbb{E}[Y(Z=1)-Y(Z=0)|T(1)=1,T(0)=0]P\big(T(1)=1,T(0)=0\big)\\\ +&\Bbb{E}[Y(Z=1)-Y(Z=0)|T(1)=1,T(0)=1]P\big(T(1)=1,T(0)=1\big)\\\ +&\Bbb{E}[Y(Z=1)-Y(Z=0)|T(1)=0,T(0)=0]P\big(T(1)=0,T(0)=0\big)\\\ +&\Bbb{E}[Y(Z=1)-Y(Z=0)|T(1)=0,T(1)=1]P\big(T(1)=0,T(1)=1\big) \end{aligned} $$

于 Always-takers 和 Never-takers 而言,$Z$ 对 $Y$ 之因果效应为 $0$,所以上式化简成

$$ \begin{aligned} \Bbb{E}[Y(Z&=1)-Y(Z=0)]\\\ =&\Bbb{E}[Y(Z=1)-Y(Z=0)|T(1)=1,T(0)=0]P\big(T(1)=1,T(0)=0\big)\\\ +&\Bbb{E}[Y(Z=1)-Y(Z=0)|T(1)=0,T(1)=1]P\big(T(1)=0,T(1)=1\big) \end{aligned} $$

若假设 Defiers 不存在(Monotonicity Assumption),即 $P\big(T(1)=0,T(1)=1\big)=0$,所以

$$ \Bbb{E}[Y(Z=1)-Y(Z=0)]=\Bbb{E}[Y(Z=1)-Y(Z=0)|T(1)=1,T(0)=0]P\big(T(1)=1,T(0)=0\big) $$

那么,

$$ \Bbb{E}[Y(Z=1)-Y(Z=0)|T(1)=1,T(0)=0]=\frac{\Bbb{E}[Y(Z=1)-Y(Z=0)]}{P\big(T(1)=1,T(0)=0\big)} $$

等式左边 $Y(Z=1)$ 和 $Y(Z=0)$ 仅考虑 Compliers,故 $Y(Z=1)=Y(T=1)$ 且 $Y(Z=0)=Y(T=0)$,有

$$ \Bbb{E}[Y(T=1)-Y(T=0)|T(1)=1,T(0)=0]=\frac{\Bbb{E}[Y(Z=1)-Y(Z=0)]}{P\big(T(1)=1,T(0)=0\big)} $$

即 LATE 为工具变量 $Z$ 对 $Y$ 之因果效应与遵从者(Compliers)机率之比值,故又称为遵从者平均因果效应(Complier Average Causal Effect, CACE)。

工具变量 $Z$ 与结果 $Y$ 无后门路径(Instrumental unconfoundedness),由期望之线性性质可得

$$ \Bbb{E}[Y(Z=1)-Y(Z=0)]=\Bbb{E}[Y|Z=1]-\Bbb[Y|Z=0] $$

此外,由于我们不能直接确定 Compliers,所以需要考虑

$$ \begin{aligned} P\big(T(1)=1,T(0)=0\big)&=1-P(T=1|Z=0)-P(T=0|Z=1)\\\ &=P(T=1|Z=1)-P(T=1|Z=0) \end{aligned} $$

其中, $P(T=1|Z=0)$ 包括 Always-takers 和 Defiers,$P(T=0|Z=1)$ 包括 Never-takers 和 Defiers。

由于 Defiers 缺席之假设,$1-P(T=1|Z=0)-P(T=0|Z=1)$ 之中仅剩下 Compliers。可进一步推算出

Never-taker or Compliers - Never-taker or Defiers,

即 $P(T=0|Z=0)-P(T=0|Z=1)$,亦或是

Always-takers or Compliers - Always-takers or Defiers,

即 $P(T=1|Z=1)-P(T=1|Z=0)$

对于二元变量 $T$ 的条件期望,$P(T=1|Z=1)-P(T=1|Z=0) \implies \Bbb{E}[T|Z=1]-\Bbb{E}[T|Z=0]$,因此

$$ \Bbb{E}[Y(T=1)-Y(T=0)|T(1)=1,T(0)=0]=\frac{\Bbb{E}[Y|Z=1]-\Bbb{E}[Y|Z=0]}{\Bbb{E}[T|Z=1]-\Bbb{E}[T|Z=0]} $$

易发现,等式右边与工具变量平均处理效应的估计等价。

但在 LATE 中,我们并未考虑个体同质化的假设,而是通过单调性假设来估计遵从者的平均处理效应。

处理异质性的理想对策

LATE 的妙处在于因人而异、精准刻画,在弱假设、处理异质性与实际应用中寻得平衡。其并非因果效应的全景,然则于局部领域中,能为我们提供精确、可信的推断。如此局部智慧,实乃因果推论之锦囊妙计。