Linear combinations of discrete random variables - Further Mathematics (9665) - Oxford AQA International AS Level

前言：随机变量的组合

欢迎来到统计学的进阶领域！在你之前的学习中，你可能已经接触过单一随机变量（例如投掷一枚骰子的结果）。但在现实世界中，情况通常没有那么简单。我们经常需要处理不同事件的组合。例如，你的总通勤时间其实就是步行时间和乘车时间的总和。

在本章中，我们将学习当我们对离散随机变量进行加、减或乘法运算时，该如何计算其平均值（期望值）和方差（离散程度）。如果一开始觉得有点棘手，不用担心——我们会把它们拆解成一套简单且通用的规则！

1. 基本概念：线性变换

在我们结合两个不同的变量之前，先快速复习一下，如果只改变单一变量（将其乘以一个数值，即缩放；或加上一个常数，即平移），会发生什么事。

若 \(X\) 为随机变量，且 \(a\) 和 \(b\) 为常数：
1. 平均值： \(E(aX + b) = aE(X) + b\)
2. 方差： \(Var(aX + b) = a^2Var(X)\)

为什么会这样？
想象全班同学在考试中每人都获得额外 5 分。全班的平均分会增加 5 分。然而，分数的离散程度（方差）会保持完全不变，因为大家的分数是一起提升的！但如果你把所有人的分数乘以 2，平均值会加倍，而离散程度则会增加 \(2^2 = 4\) 倍。

重点速览：
- 加上常数 (\(b\)) 会影响平均值，但不会影响方差。
- 乘以常数 (\(a\)) 会使平均值变为原来的 \(a\) 倍，方差则变为原来的 \(a^2\) 倍。

2. 组合两个变量：平均值法则

本章最好的消息是：平均值是非常友好的！无论两个变量之间是否相关，还是完全独立，它们的计算方式都和你预期的完全一样。

对于任何两个随机变量 \(X\) 和 \(Y\)：
\(E(aX + bY) = aE(X) + bE(Y)\)

现实例子：
如果你每小时赚 10 元 (\(X\))，你的朋友每小时赚 12 元 (\(Y\))，你们两人工作时长不同，你们总预期收入就是各自预期收入的总和。无论你们是在同一家店工作还是不同店，这个原则都适用！

核心观点：你可以随时直接对平均值进行加减。\(E(X - Y) = E(X) - E(Y)\)。

3. 组合两个变量：协方差与相关系数

在我们探讨变量组合的方差之前，我们需要先了解 \(X\) 和 \(Y\) 是如何“沟通”的。这就是协方差 (Covariance) 和 相关系数 (Correlation) 的用武之地。

协方差 \(Cov(X, Y)\)：这衡量了两个变量一起变化的程度。
- 如果 \(Cov(X, Y)\) 为正值，当 \(X\) 上升时，\(Y\) 往往也会上升。
- 如果 \(Cov(X, Y)\) 为负值，当 \(X\) 上升时，\(Y\) 往往会下降。
- 如果 \(Cov(X, Y)\) 为零，表示两者之间没有线性关系。

相关系数 (\(\rho\))：这是协方差的“标准化”版本，数值始终介于 -1 到 1 之间，比协方差更容易解读。
两者之间的公式为：
\( \rho = \frac{Cov(X, Y)}{\sqrt{Var(X)Var(Y)}} \)

小知识：

相关系数不关心单位！无论你是用厘米还是英寸来测量身高，身高与体重之间的相关系数始终保持不变。

4. 线性组合的方差

计算组合变量的方差比较复杂，因为我们必须考虑它们之间的相互影响。

通用公式：
\(Var(aX + bY) = a^2Var(X) + b^2Var(Y) + 2abCov(X, Y)\)

等等，如果是相减呢？
如果你要计算 \(Var(aX - bY)\)，公式会变成：
\(Var(aX - bY) = a^2Var(X) + b^2Var(Y) - 2abCov(X, Y)\)

常见错误警示！
学生经常忘记 \(a^2\) 和 \(b^2\)。请记住：方差永远与乘数的平方有关。即使你将变量乘以 -1，方差也会乘以 \((-1)^2 = 1\)。方差永远是表示离散程度的正数！

5. 特殊情况：独立变量

如果 \(X\) 和 \(Y\) 是独立的（意即其中一个对另一个完全没有影响），则 \(Cov(X, Y) = 0\)。这会让我们的计算变得简单许多！

对于独立变量 \(X\) 和 \(Y\)：
1. \(E(aX + bY) = aE(X) + bE(Y)\)
2. \(Var(aX + bY) = a^2Var(X) + b^2Var(Y)\)
3. \(Var(aX - bY) = a^2Var(X) + b^2Var(Y)\)

仔细看看最后一条规则！
即使你是在相减两个独立变量，你依然要相加它们的方差。
类比：想象你在裁切一块木板。木板的长度有误差 (\(X\))，你下锯的位置也有误差 (\(Y\))。当你把它们切下来时，最终成品的总“误差”或“晃动”（方差）会变大而不是变小，因为你有两个随机因素同时在起作用！

独立变量总结表：
- 运算： \(X + Y\) \(\rightarrow\) 平均值： \(E(X)+E(Y)\) \(\rightarrow\) 方差： \(Var(X)+Var(Y)\)
- 运算： \(X - Y\) \(\rightarrow\) 平均值： \(E(X)-E(Y)\) \(\rightarrow\) 方差： \(Var(X)+Var(Y)\)

6. \(n\) 个独立变量之和

有时候你处理的不只是 \(X\) 和 \(Y\)，而是同类型变量的多次观测值（例如 10 个独立苹果的总重量）。

若 \(X_1, X_2, ..., X_n\) 是同一变量 \(X\) 的独立观测值：
\(E(X_1 + X_2 + ... + X_n) = nE(X)\)
\(Var(X_1 + X_2 + ... + X_n) = nVar(X)\)

重要区别：
\(X_1 + X_2\)（两个不同的独立苹果）与 \(2X\)（将同一个苹果的重量乘以 2）之间有巨大的差别。
- \(Var(X_1 + X_2) = Var(X) + Var(X) = 2Var(X)\)
- \(Var(2X) = 2^2Var(X) = 4Var(X)\)
将单一随机测量值倍增的“风险”（方差）远大于进行两次分开测量再相加！

逐步演练：解决典型问题

问题：设 \(X\) 为红骰子的点数，\(Y\) 为蓝骰子的点数。假设骰子是独立的，求 \(S = 3X - Y\) 的平均值和方差。

第一步：确认 \(X\) 和 \(Y\) 的性质。
对于均匀的 6 面骰子：\(E(X) = 3.5\) 且 \(Var(X) = \frac{35}{12} \approx 2.917\)。

第二步：求新的平均值。
\(E(3X - Y) = 3E(X) - E(Y)\)
\(E(3X - Y) = 3(3.5) - 3.5 = 10.5 - 3.5 = 7\)。

第三步：求新的方差。
由于两者独立，使用 \(a^2Var(X) + b^2Var(Y)\) 规则。
\(Var(3X - Y) = 3^2Var(X) + (-1)^2Var(Y)\)
\(Var(3X - Y) = 9Var(X) + 1Var(Y)\)
\(Var(3X - Y) = 10 \times 2.917 = 29.17\)。

重点速览：
- 你有相加方差吗？有！
- 你有将乘数（3 和 -1）平方吗？有！

总结与关键要点

1. 平均值很简单： 遵循算式中的符号即可。
2. 方差比较棘手： 务必将常数平方，且若变量独立，方差项永远要相加。
3. 协方差很重要： 如果变量不独立，必须加入 \(2abCov(X, Y)\) 项。
4. 独立性是你的好朋友： 它通过消除协方差项来简化方差公式。
5. \(n\) 个变量 vs. \(n \times\) 单个变量： 相加 \(n\) 个独立复制品会得到 \(nVar(X)\)，但将一个变量乘以 \(n\) 则会得到 \(n^2Var(X)\)。

请多加练习这些规则！一旦你习惯了将方差的常数平方并检查独立性，这些问题将成为你在考试中最有把握的“得分点”！

* thinka提供的内容由AI生成，可能并非总是准确或最新。请将其用作辅助资源，并与官方材料进行核实。