Inference using normal and t-distributions - Mathematics - Further (9231) - Cambridge International AS Level

欢迎来到统计推论 (Statistical Inference)！

你有没有想过，为什么科学家只需测试几百人，就能宣称一种新药有效？或者民调机构如何在选票点算完成前预测选举结果？这就是统计推论的威力！

在本章中，我们将从单纯的描述数据，进阶到根据小样本对整个总体进行“有根据的猜测”。别担心，这听起来像魔法，但其实全靠逻辑以及两个非常特别的分布：正态分布 (Normal (Z) distribution) 和 t 分布 (t-distribution)。

先备知识检查：在开始之前，请记得平均值 (\(\mu\)) 代表平均数，而方差 (\(\sigma^2\)) 则告诉我们数据的离散程度。如果你以前见过“钟形曲线 (Bell Curve)”，那么你已经成功了一半！

1. 大局观：点估计 vs. 区间估计

如果我问你一个大南瓜有多重，你可能会给我一个数字（例如“50kg”），这就是点估计 (Point estimate)。但如果你想更可靠一点，你可能会说：“大概在 45kg 到 55kg 之间。”这就是区间估计 (Interval estimate)。

在本课程中，我们使用样本平均值 (\(\bar{x}\)) 作为总体平均值 (\(\mu\)) 的点估计。由于样本并非完美，我们会在该平均值周围建立一个置信区间 (Confidence Interval, CI)，来表示我们对估计有多大的把握。

2. “Z”与“t”的决策：我该用哪一个？

这是你在每一道考题中必须做出的最重要选择。用错了表格就会得出错误的答案！以下是一个简单的判断准则：

使用正态 (Z) 分布，如果：

1. 你已知总体方差 (\(\sigma^2\))。
2. 你不知道方差，但样本数量很大 (\(n \geq 30\))。在这种情况下，我们运用中心极限定理 (Central Limit Theorem)，并使用样本方差 \(s^2\) 作为估计值。

使用 t 分布，如果：

1. 你不知道总体方差 (\(\sigma^2\))。
2. 你的样本数量很小 (\(n < 30\))。
3. 关键条件：总体必须是正态分布，t 检验才会有效！

快速复习箱：
- 已知 \(\sigma^2\) \(\rightarrow\) Z
- 未知 \(\sigma^2\) + 大样本 \(n\) \(\rightarrow\) Z
- 未知 \(\sigma^2\) + 小样本 \(n\) \(\rightarrow\) t

3. 单一平均值的置信区间

置信区间为我们提供了一个范围，我们相信真实的总体平均值就落在这里。公式如下：

\(\bar{x} \pm (\text{临界值 Critical Value}) \times \frac{s}{\sqrt{n}}\)

分步流程：
1. 求 \(\bar{x}\)：你的样本平均值。
2. 求 \(s^2\)：总体方差的无偏估计量（若题目未给出）。使用公式 \(s^2 = \frac{n}{n-1} \times (\text{样本方差})\)。
3. 求临界值：
- 若使用 Z，请查阅正态分布表中的百分比（例如 95% 对应 1.96）。
- 若使用 t，你需要自由度 (Degrees of Freedom, \(\nu = n - 1\))。在 t 分布表中找到对应显著水平的数值。
4. 计算误差范围 (Margin of Error)：将临界值乘以标准误 (\(\frac{s}{\sqrt{n}}\))。
5. 写出区间：(下界, 上界)。

例：如果你测量了 10 条巧克力棒，发现平均重量为 50g，且 \(s = 2\)，那么你的 t 检验自由度为 \(10 - 1 = 9\)。

重点提示：99% 的置信区间会比 95% 的区间更宽，因为你想要“更有把握”，这意味着你需要一个更大的安全网！

4. 假设检验：5 步逻辑

假设检验就像一场法庭审判。我们预设“零假设 (\(H_0\))”是正确的（清白），直到我们有足够的证据证明“对立假设 (\(H_1\))”（有罪）。

步骤如下：

1. 陈述假设：
- \(H_0: \mu = \text{数值}\)
- \(H_1: \mu \neq, <, \text{ 或 } > \text{数值}\)

2. 计算检验统计量 (Test Statistic)：
- 使用 Z：\(z = \frac{\bar{x} - \mu}{\sigma / \sqrt{n}}\)
- 使用 t：\(t = \frac{\bar{x} - \mu}{s / \sqrt{n}}\)

3. 确定临界值或 p 值：
根据显著水平（通常为 5% 或 1%）查表。

4. 比较：
如果你的计算结果距离零点比临界值还远，那么这“不太可能”是由偶然造成的。

5. 结合情境下结论：
不要只写“拒绝 \(H_0\)”。请写：“有显著的证据显示巧克力棒的平均重量已经减少了。”

5. 比较两个平均值（独立样本）

有时我们想知道两组数据是否有差异——例如：“男生在这项测验中的分数是否高于女生？”

为此，我们要观察平均值的差异：\((\bar{x}_1 - \bar{x}_2)\)。

当两组数据使用 t 分布时：

在进阶数学 9231 中，我们通常假设两个总体具有相同的方差。我们将它们合并 (pool) 以获得合并估计量 (\(s_p^2\))。

合并方差公式：
\(s_p^2 = \frac{(n_1 - 1)s_1^2 + (n_2 - 1)s_2^2}{n_1 + n_2 - 2}\)

自由度：对于两个样本，\(\nu = n_1 + n_2 - 2\)。

常见错误：学生常忘记将两个样本数相加后再减去 2。请记住：两个样本，就要失去两个自由度！

6. 配对样本（“前后”检验）

想象一下测试一种饮食疗法。你测量了 10 个人前和后的体重。这些并非独立的群组；他们是同一个人！这就是配对样本 t 检验 (Matched Pairs t-test)。

技巧：
1. 计算每个人的差值 (\(d\))（后减前）。
2. 将这些差值视为你的新单一样本。
3. 检验这些差值的平均值 (\(\mu_d\)) 是否为零。
4. 使用 \(\nu = n - 1\)，其中 \(n\) 为配对的数量。

你知道吗？使用配对样本检验比独立检验更有效力，因为它忽略了人与人之间的差异，只关注每个人内部的变化。

7. 成功总结检查表

- 检查你的 \(n\)：是小样本还是大样本？
- 检查你的 \(\sigma^2\)：是已知还是估计值？
- 陈述你的假设：若使用 t 检验，一定要写：“假设总体为正态分布”。
- 确认尾数：是单尾检验（例如“增加”）还是双尾检验（例如“改变”）？
- 情境最重要：一定要将最终答案与题目中提到的南瓜、巧克力棒或测验分数联系起来！

如果起初觉得这些很困难，别担心！统计推论就像学习一门新语言。一旦你掌握了“语法”（那 5 个步骤），“词汇”（公式）就会开始变得完全合理且易于理解了。

* thinka提供的内容由AI生成，可能并非总是准确或最新。请将其用作辅助资源，并与官方材料进行核实。