敏感性分析:衡量因果推论之稳定性
敏感性分析(sensitivity analysis)乃衡量因果推论之稳定性所用。当研究中存有不可观测混淆因素时,结论或受此影响而失真,敏感性分析可助吾等评估此种未知因素对估计因果效应之干扰程度。今撰此小文,略述其要义。
基本原理
敏感性分析旨在通过设定不同假想情境,量化未观测混淆之潜在影响。其核心在于引入两个参数:一为混淆因素对处理(treatment)的影响,二为混淆因素对结果(outcome)的影响。通过调整此等参数之值,吾辈可模拟不同程度之混淆,并观察因果效应估计之变化。
若吾等发现某结论在较大范围之参数变动中仍保持稳健,则可对所得推断更有信心;反之,若结论在微小假设变化下便剧烈波动,则应审慎看待,或重新考虑所用之假设。
举例而言,在一个线性模型中,考虑可观测的共因 $W$,和不可观测的共因 $U$:
$$ \begin{aligned} T &:= \alpha_w W + \alpha_u U\\\ Y &:= \beta_w W + \beta_u U + \delta T \end{aligned} $$其中,$\alpha_u$ 乃是混淆因素 $U$ 对处理 $T$ 的影响, $\beta_u$ 则为混淆因素 $U$ 对结果 $Y$ 的影响,$T$ 对 $Y$ 之因果效应表示为 $\delta$。
由调整公式得
$$ \Bbb{E}[Y(1)-Y(0)]=\Bbb{E}_{W,U}\big[\Bbb{E}[Y|T=1,W,U]-\Bbb{E}[Y|T=0,W,U]\big]=\delta $$因 $U$ 不可观测,故我们只能对 $W$ 进行调整,混淆因素所致之偏差为 $\frac{\beta_u}{\alpha_u}$。
$$ \Bbb{E}_{W}\big[\Bbb{E}[Y|T=1,W]-\Bbb{E}[Y|T=0,W]\big]-\Bbb{E}_{W,U}\big[\Bbb{E}[Y|T=1,W,U]-\Bbb{E}[Y|T=0,W,U]\big]=\frac{\beta_u}{\alpha_u} $$证明
据 $Y$ 与 $T$ 之结构方程,可推出 $\implies U=\frac{T-\alpha_w W}{\alpha_u}$,故有
$$ \begin{aligned} \Bbb{E}_W\big[\Bbb{E}[Y|T=t,W]\big] &=\Bbb{E}_W\big[\Bbb{E}[\beta_w W + \beta_u U + \delta T|T=t,W]\big] \\\ &=\Bbb{E}_W\left[\beta_w W + \beta_u \Bbb{E}[U|T=t,W] + \delta t\right] \\\ &=\Bbb{E}_W\left[\beta_w W + \beta_u \left(\frac{t-\alpha_w W}{\alpha_u}\right) + \delta t\right] \\\ &=\Bbb{E}_W\left[\beta_w W + \frac{\beta_u}{\alpha_u}t - \frac{\beta_u\alpha_w}{\alpha_u}W + \delta t\right] \\\ &=\beta_w\Bbb{E}[W]+\frac{\beta_u}{\alpha_u}t - \frac{\beta_u\alpha_w}{\alpha_u}\Bbb{E}[W] + \delta t \\\ &=\left(\beta_w - \frac{\beta_u\alpha_w}{\alpha_u}\right)\Bbb{E}[W]+\left(\delta+\frac{\beta_u}{\alpha_u}\right) t \end{aligned} $$若我们对 $W$ 进行调整时,根据上式来估计 ATE
$$ \begin{aligned} \Bbb{E}_{W}\big[\Bbb{E}[Y|T=1,W]-\Bbb{E}[Y|T=0,W]\big]- &=\left(\beta_w - \frac{\beta_u\alpha_w}{\alpha_u}\right)\Bbb{E}[W]+\left(\delta+\frac{\beta_u}{\alpha_u} \right) t \\\&=\delta+\frac{\beta_u}{\alpha_u} \end{aligned} $$则混淆因素所致偏差为:
$$ \begin{aligned} \text{bias}&=\Bbb{E}_{W}\big[\Bbb{E}[Y|T=1,W]-\Bbb{E}[Y|T=0,W]\big]\\\ &\qquad-\Bbb{E}_{W,U}\big[\Bbb{E}[Y|T=1,W,U]-\Bbb{E}[Y|T=0,W,U]\big]\\\ &=\delta+\frac{\beta_u}{\alpha_u}-\delta\\\ &=\frac{\beta_u}{\alpha_u} \end{aligned} $$等高线图
$T$ 对 $Y$ 之因果效应为:
$$ \delta=\Bbb{E}_{W}\big[\Bbb{E}[Y|T=1,W]-\Bbb{E}[Y|T=0,W]\big]-\frac{\beta_u}{\alpha_u} $$以 $\frac{1}{\alpha_u}$ 为 $x$ 轴,$\beta_u$ 为 $y$ 轴,则偏差 $\frac{\beta_u}{\alpha_u}$ 的等高线图(contour plot)如下,
假设 $\Bbb{E}_W\big[\Bbb{E}[Y|T=1]-\Bbb{E}[Y|T=0]\big]=25$,将图中等高线视为真实的 ATE,即 $\delta=\Bbb{E}_W[\dots]-\text{bias}$,以绿色等高线为界,其上方($y$ 轴正方向)的等高线表示 $T$ 对 $Y$ 具有负向因果效应,下方等高线则表示正向因果效应。
应用与局限
敏感性分析之优长在于其不苛求全然无混淆假设,然则其结果多为相对粗略之评估。此等方法虽能揭示结论之稳定性,但最终需依赖研究者对分析结果之解释。不同领域中,适用之具体假设及参数设定或各有不同,故需谨慎选择。