Hypothesis tests - Mathematics (9709) - Cambridge International AS Level

欢迎来到假设检验 (Hypothesis Testing) 的世界！

你有没有试过提出一个观点，然后被别人要求：「拿出证据来！」？简而言之，这就是假设检验的核心概念。在这个章节中，我们不仅仅是在做数学运算；我们正在学习如何运用数据来判断一个关于总体的论点是真有其事，还是仅仅出于随机巧合。

无论你是在测试一种新药是否有效，还是测试一枚硬币是否被动过手脚，背后的逻辑都是一样的。如果刚开始觉得这有点像「数学界律师」的辩论，别担心——我们将会一步步为你拆解！

1. 假设检验的术语

在我们开始计算之前，需要先掌握这些专业名词。你可以把假设检验想象成一场法庭审判。

原假设 (Null Hypothesis) \( (H_0) \)

这代表「现状」或「无罪推定」的立场。它假设一切都没有改变，或者某个因素并没有产生特别的效应。
例如：「硬币是公平的」或「药物没有任何疗效」。

备择假设 (Alternative Hypothesis) \( (H_1) \)

这是我们真正想要检验的论点。也就是你怀疑可能为真的情况。
例如：「硬币倾向于出现正面」或「药物确实有效」。

显著性水平 (Significance Level) \( (\alpha) \)

这是我们评估证据的「门槛」。通常我们使用 5% (0.05) 或 1% (0.01)。这代表当我们拒绝原假设时，愿意承担「判断错误」的风险概率。百分比越小，我们所需要的证据就必须越强而有力！

重点复习框：
• \(H_0\)： 没有改变、没有影响（一律使用 \( = \) 符号）。
• \(H_1\)： 有所变化或出现影响（使用 \( < \)、\( > \) 或 \( \neq \)）。
• 检验统计量 (Test Statistic)： 我们从样本中实际得到的结果。

2. 单尾检验 vs. 双尾检验

我们如何撰写 \(H_1\) 取决于我们想寻找什么结果：

1. 单尾检验 (One-Tailed Test)： 当我们怀疑变化是朝着特定方向时使用（例如：「平均值增加了」\( \mu > 10 \) 或「概率减少了」\( p < 0.5 \)）。
2. 双尾检验 (Two-Tailed Test)： 当我们认为情况已经改变，但不知道是变大还是变小时使用（例如：「平均值不再是 10」\( \mu \neq 10 \)）。

记忆小撇步： 如果题目提到「增加」(increased) 或「减少」(decreased)，那就是单尾检验。如果题目提到「改变」(changed) 或「不同」(is different)，那就是双尾检验！

3. 出错的可能：第一类错误与第二类错误

在统计学中，我们永远无法达到 100% 的确定性。这导致了两种「尴尬」的时刻：

第一类错误 (Type I Error)： 在 \(H_0\) 其实是真的情况下，却拒绝了它。
类比：将一个无辜的人定罪。
第一类错误的概率正好等于显著性水平！

第二类错误 (Type II Error)： 在 \(H_0\) 其实是假的情况下，却接受（未能拒绝）它。
类比：让一个有罪的人逍遥法外。

核心观念： 我们希望将这些错误保持在尽可能低的水平，但通常情况下，若要减少其中一种错误发生的概率，另一种错误发生的概率就会升高！

4. 比率检验 (二项分布)

当你面对的是「成功」与「失败」的二元结果时使用。例如，测试一枚骰子掷出 '6' 的概率是否比预期高。

步骤流程：

1. 列出 \(H_0\) 和 \(H_1\)： 例如：\(H_0: p = 0.2\)，\(H_1: p > 0.2\)。
2. 列出分布模型： 使用 \(H_0\) 中的 \(p\) 值，写出 \( X \sim B(n, p) \)。
3. 计算概率： 找出获得你观察到的结果或更极端结果的概率。如果你观察到 \(k\) 次成功，找出 \( P(X \geq k) \)。
4. 与 \(\alpha\) 比较：
• 如果概率 \( < \alpha \)：拒绝 \(H_0\)（证据显示情况有变）。
• 如果概率 \( \geq \alpha \)：不拒绝 \(H_0\)（证据不足）。

常犯错误： 当进行双尾检验时，你必须将显著性水平在两端各减半，或是将计算出的 p-value 加倍后再与 \(\alpha\) 比较！

5. 泊松分布的平均值检验

这适用于在时间或空间中发生的事件（例如一场球赛中的进球数或电线上的瑕疵点）。

若 \( X \sim Po(\lambda) \)，我们检验的是速率 \( \lambda \)。
步骤与二项分布检验完全相同，但请使用泊松公式：\( P(X = r) = \frac{e^{-\lambda} \lambda^r}{r!} \)。

你知道吗？ 如果你的泊松平均值 \( \lambda \) 很大（通常 \( > 15 \)），你可以使用正态分布近似法 (Normal Approximation) 来简化检验过程！

6. 正态分布的平均值检验

这是考试中最常见的题目之一。当我们知道总体方差 \( \sigma^2 \)，但想检验平均值 \( \mu \) 是否改变时使用。

中心极限定理 (CLT) 提醒：

当我们抽取样本大小为 \(n\) 时，样本平均值 \( \bar{X} \) 会服从正态分布：
\( \bar{X} \sim N\left(\mu, \frac{\sigma^2}{n}\right) \)

如何计算检验统计量 (Z-score)：

\( Z = \frac{\bar{x} - \mu}{\frac{\sigma}{\sqrt{n}}} \)

步骤：
1. 使用上述公式计算你的 Z值。
2. 从统计表中根据给定的显著性水平找出临界值 (Critical Value)（例如：5% 单尾检验时为 1.645）。
3. 比较： 如果你的 Z值距离零比临界值更远，则拒绝 \(H_0\)。

小提示： 永远画一张正态分布曲线的草图，并将「拒绝域」(Rejection Region，即尾部) 涂阴影。如果你的 Z-score 落入阴影区，\(H_0\) 就被「淘汰」了！

7. 总结清单

在你合上课本之前，请确认你已经做到：
• 能正确使用正确符号 (\(p, \lambda, \text{ 或 } \mu\)) 撰写 \(H_0\) 和 \(H_1\)。
• 能辨识检验是单尾还是双尾。
• 能计算二项分布和泊松分布检验的 p-value。
• 能计算正态检验的 Z-score 并与临界值进行比较。
• 能在题目背景下陈述你的结论（例如：「有 5% 水平的证据显示平均高度有所增加」）。

最后的鼓励： 假设检验不过是一个由数据支持的逻辑论证。熟练掌握这些步骤，你会发现这是考纲中最具规律性且容易拿高分的部分！你可以做到的！

* thinka提供的内容由AI生成，可能并非总是准确或最新。请将其用作辅助资源，并与官方材料进行核实。