前言:随机变量的组合
欢迎来到统计学的进阶领域!在你之前的学习中,你可能已经接触过单一随机变量(例如投掷一枚骰子的结果)。但在现实世界中,情况通常没有那么简单。我们经常需要处理不同事件的组合。例如,你的总通勤时间其实就是步行时间和乘车时间的总和。
在本章中,我们将学习当我们对离散随机变量进行加、减或乘法运算时,该如何计算其平均值(期望值)和方差(离散程度)。如果一开始觉得有点棘手,不用担心——我们会把它们拆解成一套简单且通用的规则!
1. 基本概念:线性变换
在我们结合两个不同的变量之前,先快速复习一下,如果只改变单一变量(将其乘以一个数值,即缩放;或加上一个常数,即平移),会发生什么事。
若 \(X\) 为随机变量,且 \(a\) 和 \(b\) 为常数:
1. 平均值: \(E(aX + b) = aE(X) + b\)
2. 方差: \(Var(aX + b) = a^2Var(X)\)
为什么会这样?
想象全班同学在考试中每人都获得额外 5 分。全班的平均分会增加 5 分。然而,分数的离散程度(方差)会保持完全不变,因为大家的分数是一起提升的!但如果你把所有人的分数乘以 2,平均值会加倍,而离散程度则会增加 \(2^2 = 4\) 倍。
重点速览:
- 加上常数 (\(b\)) 会影响平均值,但不会影响方差。
- 乘以常数 (\(a\)) 会使平均值变为原来的 \(a\) 倍,方差则变为原来的 \(a^2\) 倍。
2. 组合两个变量:平均值法则
本章最好的消息是:平均值是非常友好的!无论两个变量之间是否相关,还是完全独立,它们的计算方式都和你预期的完全一样。
对于任何两个随机变量 \(X\) 和 \(Y\):
\(E(aX + bY) = aE(X) + bE(Y)\)
现实例子:
如果你每小时赚 10 元 (\(X\)),你的朋友每小时赚 12 元 (\(Y\)),你们两人工作时长不同,你们总预期收入就是各自预期收入的总和。无论你们是在同一家店工作还是不同店,这个原则都适用!
核心观点:你可以随时直接对平均值进行加减。\(E(X - Y) = E(X) - E(Y)\)。
3. 组合两个变量:协方差与相关系数
在我们探讨变量组合的方差之前,我们需要先了解 \(X\) 和 \(Y\) 是如何“沟通”的。这就是协方差 (Covariance) 和 相关系数 (Correlation) 的用武之地。
协方差 \(Cov(X, Y)\):这衡量了两个变量一起变化的程度。
- 如果 \(Cov(X, Y)\) 为正值,当 \(X\) 上升时,\(Y\) 往往也会上升。
- 如果 \(Cov(X, Y)\) 为负值,当 \(X\) 上升时,\(Y\) 往往会下降。
- 如果 \(Cov(X, Y)\) 为零,表示两者之间没有线性关系。
相关系数 (\(\rho\)):这是协方差的“标准化”版本,数值始终介于 -1 到 1 之间,比协方差更容易解读。
两者之间的公式为:
\( \rho = \frac{Cov(X, Y)}{\sqrt{Var(X)Var(Y)}} \)
小知识:
相关系数不关心单位!无论你是用厘米还是英寸来测量身高,身高与体重之间的相关系数始终保持不变。
4. 线性组合的方差
计算组合变量的方差比较复杂,因为我们必须考虑它们之间的相互影响。
通用公式:
\(Var(aX + bY) = a^2Var(X) + b^2Var(Y) + 2abCov(X, Y)\)
等等,如果是相减呢?
如果你要计算 \(Var(aX - bY)\),公式会变成:
\(Var(aX - bY) = a^2Var(X) + b^2Var(Y) - 2abCov(X, Y)\)
常见错误警示!
学生经常忘记 \(a^2\) 和 \(b^2\)。请记住:方差永远与乘数的平方有关。即使你将变量乘以 -1,方差也会乘以 \((-1)^2 = 1\)。方差永远是表示离散程度的正数!
5. 特殊情况:独立变量
如果 \(X\) 和 \(Y\) 是独立的(意即其中一个对另一个完全没有影响),则 \(Cov(X, Y) = 0\)。这会让我们的计算变得简单许多!
对于独立变量 \(X\) 和 \(Y\):
1. \(E(aX + bY) = aE(X) + bE(Y)\)
2. \(Var(aX + bY) = a^2Var(X) + b^2Var(Y)\)
3. \(Var(aX - bY) = a^2Var(X) + b^2Var(Y)\)
仔细看看最后一条规则!
即使你是在相减两个独立变量,你依然要相加它们的方差。
类比:想象你在裁切一块木板。木板的长度有误差 (\(X\)),你下锯的位置也有误差 (\(Y\))。当你把它们切下来时,最终成品的总“误差”或“晃动”(方差)会变大而不是变小,因为你有两个随机因素同时在起作用!
独立变量总结表:
- 运算: \(X + Y\) \(\rightarrow\) 平均值: \(E(X)+E(Y)\) \(\rightarrow\) 方差: \(Var(X)+Var(Y)\)
- 运算: \(X - Y\) \(\rightarrow\) 平均值: \(E(X)-E(Y)\) \(\rightarrow\) 方差: \(Var(X)+Var(Y)\)
6. \(n\) 个独立变量之和
有时候你处理的不只是 \(X\) 和 \(Y\),而是同类型变量的多次观测值(例如 10 个独立苹果的总重量)。
若 \(X_1, X_2, ..., X_n\) 是同一变量 \(X\) 的独立观测值:
\(E(X_1 + X_2 + ... + X_n) = nE(X)\)
\(Var(X_1 + X_2 + ... + X_n) = nVar(X)\)
重要区别:
\(X_1 + X_2\)(两个不同的独立苹果)与 \(2X\)(将同一个苹果的重量乘以 2)之间有巨大的差别。
- \(Var(X_1 + X_2) = Var(X) + Var(X) = 2Var(X)\)
- \(Var(2X) = 2^2Var(X) = 4Var(X)\)
将单一随机测量值倍增的“风险”(方差)远大于进行两次分开测量再相加!
逐步演练:解决典型问题
问题:设 \(X\) 为红骰子的点数,\(Y\) 为蓝骰子的点数。假设骰子是独立的,求 \(S = 3X - Y\) 的平均值和方差。
第一步:确认 \(X\) 和 \(Y\) 的性质。
对于均匀的 6 面骰子:\(E(X) = 3.5\) 且 \(Var(X) = \frac{35}{12} \approx 2.917\)。
第二步:求新的平均值。
\(E(3X - Y) = 3E(X) - E(Y)\)
\(E(3X - Y) = 3(3.5) - 3.5 = 10.5 - 3.5 = 7\)。
第三步:求新的方差。
由于两者独立,使用 \(a^2Var(X) + b^2Var(Y)\) 规则。
\(Var(3X - Y) = 3^2Var(X) + (-1)^2Var(Y)\)
\(Var(3X - Y) = 9Var(X) + 1Var(Y)\)
\(Var(3X - Y) = 10 \times 2.917 = 29.17\)。
重点速览:
- 你有相加方差吗?有!
- 你有将乘数(3 和 -1)平方吗?有!
总结与关键要点
1. 平均值很简单: 遵循算式中的符号即可。
2. 方差比较棘手: 务必将常数平方,且若变量独立,方差项永远要相加。
3. 协方差很重要: 如果变量不独立,必须加入 \(2abCov(X, Y)\) 项。
4. 独立性是你的好朋友: 它通过消除协方差项来简化方差公式。
5. \(n\) 个变量 vs. \(n \times\) 单个变量: 相加 \(n\) 个独立复制品会得到 \(nVar(X)\),但将一个变量乘以 \(n\) 则会得到 \(n^2Var(X)\)。
请多加练习这些规则!一旦你习惯了将方差的常数平方并检查独立性,这些问题将成为你在考试中最有把握的“得分点”!