<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>Dag on TouchingFish.top</title><link>https://touchingfish.top/tags/dag/</link><description>Recent content in Dag on TouchingFish.top</description><generator>Hugo</generator><language>zh-cn</language><lastBuildDate>Sun, 03 Apr 2022 00:00:00 +0000</lastBuildDate><atom:link href="https://touchingfish.top/tags/dag/index.xml" rel="self" type="application/rss+xml"/><item><title>BEF研究中的因果假设争论</title><link>https://touchingfish.top/2022/scm-is-a-causal-hypothesis/</link><pubDate>Sun, 03 Apr 2022 00:00:00 +0000</pubDate><guid>https://touchingfish.top/2022/scm-is-a-causal-hypothesis/</guid><description>&lt;h2 id="引言"&gt;引言&lt;/h2&gt;
&lt;blockquote&gt;
&lt;p&gt;a specific SCM is a causal hypothesis. Fitting to data gives you feedback about your hypothesis (and more). It represents a workflow that can lead to stunning advances. It&amp;rsquo;s not a magical box that you put your data into, shake, and watch all causal relationships fall out.&lt;/p&gt;
&lt;p&gt;— Don Schoolmaster, 05 Feb 2023&lt;/p&gt;
&lt;/blockquote&gt;
&lt;p&gt;生物多样性-生态系统功能（Biodiversity-Ecosystem Function, BEF）研究是生态学中最具争议的领域之一。自1990年代以来，大量研究表明物种多样性与生态系统功能之间存在正相关关系。然而，这种相关性是否代表因果关系，一直是激烈辩论的焦点。&lt;/p&gt;
&lt;p&gt;2020年，Schoolmaster、Zirbel和Cronin（SZC）在《Ecology》发表了一篇论文，运用图形因果模型（Graphical Causal Model）重新审视BEF研究中的因果假设。随后，Grace、Loreau和Schmid（GLS）在2021年发表评论文章批评SZC的模型，SZC则在2022年发表回复。这场学术争论不仅涉及BEF研究的核心问题，更触及因果推论方法论的根本。&lt;/p&gt;
&lt;h2 id="标准因果模型的问题"&gt;标准因果模型的问题&lt;/h2&gt;
&lt;h3 id="传统bef研究的因果假设"&gt;传统BEF研究的因果假设&lt;/h3&gt;
&lt;p&gt;传统BEF研究隐含的因果模型可以表示为：&lt;/p&gt;
&lt;pre tabindex="0"&gt;&lt;code&gt;E → B → Q → F
&lt;/code&gt;&lt;/pre&gt;&lt;p&gt;其中：&lt;/p&gt;</description></item><item><title>贝叶斯网络：因果图模型的前身</title><link>https://touchingfish.top/2022/bayesian-network/</link><pubDate>Mon, 20 Dec 2021 00:00:00 +0000</pubDate><guid>https://touchingfish.top/2022/bayesian-network/</guid><description>&lt;p&gt;贝叶斯网络（Bayesian Network），作为一种图形化模型，早在20世纪末便广为流传，其主要用以描述随机变量之间的条件独立性与概率分布关系。它以有向无环图（Directed Acyclic Graph, DAG）为基础，将复杂的概率系统分解为易于处理的子结构。&lt;/p&gt;
&lt;p&gt;在这一框架下，每个节点代表一个随机变量，每条有向边则表示变量间的条件依赖。例如，在贝叶斯网络中，若变量 $X$ 指向 $Y$，这仅表示给定 $X$ 的条件下，$Y$ 的概率分布被决定。&lt;/p&gt;
&lt;h2 id="条件独立性的理论基础"&gt;条件独立性的理论基础&lt;/h2&gt;
&lt;p&gt;考虑我们将要进行建模的分布为 $P(x_1,x_2,\dots,x_n)$，根据链式法则（chain rule），对其进行分解：&lt;/p&gt;
$$
\begin{aligned}
P(x_1,x_2,\dots,x_n)&amp;=P(x_n|x_{n-1},\dots,x_1)P(x_{n-1}|x_{n-2},\dots,x_1)\cdots P(x_2|x_1)P(x_1)\\&amp;=P(x_1)\prod_iP(x_i|x_{i-1},\dots,x_1)
\end{aligned}
$$&lt;p&gt;假设 $x_i$ 均为二元变量（binary），其中 $i=1,2,3,\dots,n$。当考虑 $3$ 个变量时（$n=3$），需要建模的因子 $P(x_3|x_2,x_1)$ 有 $4$ 个参数（parameters）：&lt;/p&gt;
&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;$x_1$&lt;/th&gt;
 &lt;th&gt;$x_2$&lt;/th&gt;
 &lt;th&gt;$P(x_3\|x_2,x_1)$&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;0&lt;/td&gt;
 &lt;td&gt;0&lt;/td&gt;
 &lt;td&gt;$a_1$&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;0&lt;/td&gt;
 &lt;td&gt;1&lt;/td&gt;
 &lt;td&gt;$a_2$&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;1&lt;/td&gt;
 &lt;td&gt;0&lt;/td&gt;
 &lt;td&gt;$a_3$&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;1&lt;/td&gt;
 &lt;td&gt;1&lt;/td&gt;
 &lt;td&gt;$a_4$&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;当考虑 $4$ 个变量时（$n=4$），参数为 $8$ 个。&lt;/p&gt;
&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;$x_1$&lt;/th&gt;
 &lt;th&gt;$x_2$&lt;/th&gt;
 &lt;th&gt;$x_3$&lt;/th&gt;
 &lt;th&gt;$P(x_4\|x_3,x_2,x_1)$&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;0&lt;/td&gt;
 &lt;td&gt;0&lt;/td&gt;
 &lt;td&gt;0&lt;/td&gt;
 &lt;td&gt;$a_1$&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;0&lt;/td&gt;
 &lt;td&gt;0&lt;/td&gt;
 &lt;td&gt;1&lt;/td&gt;
 &lt;td&gt;$a_2$&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;0&lt;/td&gt;
 &lt;td&gt;1&lt;/td&gt;
 &lt;td&gt;1&lt;/td&gt;
 &lt;td&gt;$a_3$&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;0&lt;/td&gt;
 &lt;td&gt;1&lt;/td&gt;
 &lt;td&gt;0&lt;/td&gt;
 &lt;td&gt;$a_4$&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;1&lt;/td&gt;
 &lt;td&gt;1&lt;/td&gt;
 &lt;td&gt;1&lt;/td&gt;
 &lt;td&gt;$a_5$&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;1&lt;/td&gt;
 &lt;td&gt;1&lt;/td&gt;
 &lt;td&gt;0&lt;/td&gt;
 &lt;td&gt;$a_6$&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;1&lt;/td&gt;
 &lt;td&gt;0&lt;/td&gt;
 &lt;td&gt;0&lt;/td&gt;
 &lt;td&gt;$a_7$&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;1&lt;/td&gt;
 &lt;td&gt;0&lt;/td&gt;
 &lt;td&gt;1&lt;/td&gt;
 &lt;td&gt;$a_8$&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;也就是说，对 $P(x_n|x_{n-1},\dots,x_1)$ 进行建模必要的参数为 $2^{n-1}$ 个，随着 $n$ 的增加呈指数型增长。&lt;/p&gt;</description></item><item><title>结构性的因果关系表征（因果图）</title><link>https://touchingfish.top/2022/structural-causal-model/</link><pubDate>Sat, 20 Nov 2021 00:00:00 +0000</pubDate><guid>https://touchingfish.top/2022/structural-causal-model/</guid><description>&lt;p&gt;传统的因果推断（causal inference）多依赖于回归模型与假设检验，着重于处理数据中变量间的关联性，而忽视了因果关系的结构性。因果图模型的引入，则为我们提供了一种全新的视角，可谓因果推断领域的一大颠覆。&lt;/p&gt;
&lt;h2 id="结构方程"&gt;结构方程&lt;/h2&gt;
&lt;p&gt;相比传统回归分析的变量间关联，结构因果模型强调因果关系的显性表达，为我们提供了更多的信息。例如，$M$ 是一个结构因果模型（structural causal model），其中 $V=\{Z,X,Y\}$ 是研究中所讨论因果关系的变量，称为内生变量（endogenous variables），$U=\{U_z.U_x,U_y\}$ 是外生变量（exogenous variables），代表研究中没有被明确建模的扰动（disturbances）。&lt;/p&gt;
&lt;p&gt;函数 $F=\{f_z,f_x.f_y\}$ 称为结构方程（structural equations），每个函数表示对应的内生变量的数据生成机制，即对应的内生变量的值由其他变量的值所决定的因果过程。&lt;/p&gt;
$$
M=\begin{cases}
Z \leftarrow f_z(U_z)\\
X \leftarrow f_x(Z,U_x)\\
Y \leftarrow f_y(X,Z,U_y)\\
U \sim P(U)
\end{cases}
$$&lt;p&gt;$P(U)$ 表示外生变量相关联的概率分布，在本例中，假设外生变量是相互独立的。结构因果模型 $M$ 表示内生变量的联合分布 $P(V)$，称作观测分布（observational distribution）。&lt;/p&gt;
&lt;h2 id="有向无环图"&gt;有向无环图&lt;/h2&gt;
&lt;p&gt;每一个结构因果模型 $M$ 有一个对应的因果图 $G$，直观地刻画了各个变量之间的因果关系，每个节点表示模型 $M$ 中的一个变量（Variables，$V$），图中每一条边都表示变量之间的因果效应，箭头 $V_i \to V_j$ 说明变量 $V_i$ 是变量 $V_j$ 的直接原因（$V_i$ 出现在 $V_j$ 的结构方程中），表现为一个有向无环图（directed acyclic graph, DAG）。&lt;/p&gt;
&lt;p&gt;&lt;img src="SCM.svg" alt=""&gt;&lt;/p&gt;
&lt;p&gt;通常情况下，因果图不会将外生变量明确地表示出来。如果外生变量非独立，即同时存在结构方程 $f_{v_i}$ 和 $f_{v_j}$ 中时，可以用虚线的双向箭头 $V_i \dashleftarrow\dashrightarrow V_j$ 表示。&lt;/p&gt;
&lt;h2 id="do-算子"&gt;&lt;em&gt;do&lt;/em&gt; 算子&lt;/h2&gt;
&lt;p&gt;关于因果关系的讨论中，Fisher 的随机化试验是实验性研究的黄金标准，而是否能够进行操纵（manipulability）被认为是讨论因果关系的先决条件，并形成了“无操纵不因果”（“no causation without manipulation”）的观念。&lt;/p&gt;</description></item></channel></rss>