<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>Correlation on TouchingFish.top</title><link>https://touchingfish.top/tags/correlation/</link><description>Recent content in Correlation on TouchingFish.top</description><generator>Hugo</generator><language>zh-cn</language><lastBuildDate>Fri, 08 Dec 2023 00:00:00 +0000</lastBuildDate><atom:link href="https://touchingfish.top/tags/correlation/index.xml" rel="self" type="application/rss+xml"/><item><title>r = β*</title><link>https://touchingfish.top/2023/pearson-correlation-regression/</link><pubDate>Fri, 08 Dec 2023 00:00:00 +0000</pubDate><guid>https://touchingfish.top/2023/pearson-correlation-regression/</guid><description>&lt;p&gt;Pearson相关系数 $r$ 是统计101的必修内容。定义是：&lt;/p&gt;
$$
r = \frac{\sum (X_i - \bar{X})(Y_i - \bar{Y})}{\sqrt{\sum (X_i - \bar{X})^2 \sum (Y_i - \bar{Y})^2}}
$$&lt;p&gt;就是&amp;quot;协方差除以两个标准差的乘积&amp;quot;。取值范围 $[-1, 1]$，绝对值越大说明线性相关越强。&lt;/p&gt;
&lt;p&gt;而回归系数 $\beta_1$ 是：&lt;/p&gt;
$$
\beta_1 = \frac{\sum (X_i - \bar{X})(Y_i - \bar{Y})}{\sum (X_i - \bar{X})^2}
$$&lt;p&gt;长得有点像，但不是同一个东西。$\beta_1$ 可以大于 $1$，单位取决于 $Y$ 和 $X$ 的单位。&lt;/p&gt;
&lt;p&gt;这两个公式之间有什么精确的关系？如果你把 $X$ 和 $Y$ 都标准化（减去均值再除以标准差），回归系数就变成了 $r$。&lt;/p&gt;
&lt;h2 id="标准化回归"&gt;标准化回归&lt;/h2&gt;
&lt;p&gt;定义标准化变量：&lt;/p&gt;
$$
X_i^* = \frac{X_i - \bar{X}}{s_X}, \quad Y_i^* = \frac{Y_i - \bar{Y}}{s_Y}
$$&lt;p&gt;其中 $s_X$ 和 $s_Y$ 分别是 $X$ 和 $Y$ 的样本标准差。标准化后，两个变量的均值都是 $0$，标准差都是 $1$。&lt;/p&gt;</description></item></channel></rss>