欢迎来到假设检验 (Hypothesis Testing) 的世界!

你有没有试过提出一个观点,然后被别人要求:「拿出证据来!」?简而言之,这就是假设检验的核心概念。在这个章节中,我们不仅仅是在做数学运算;我们正在学习如何运用数据来判断一个关于总体的论点是真有其事,还是仅仅出于随机巧合。

无论你是在测试一种新药是否有效,还是测试一枚硬币是否被动过手脚,背后的逻辑都是一样的。如果刚开始觉得这有点像「数学界律师」的辩论,别担心——我们将会一步步为你拆解!

1. 假设检验的术语

在我们开始计算之前,需要先掌握这些专业名词。你可以把假设检验想象成一场法庭审判

原假设 (Null Hypothesis) \( (H_0) \)

这代表「现状」或「无罪推定」的立场。它假设一切都没有改变,或者某个因素并没有产生特别的效应。
例如:「硬币是公平的」或「药物没有任何疗效」。

备择假设 (Alternative Hypothesis) \( (H_1) \)

这是我们真正想要检验的论点。也就是你怀疑可能为真的情况。
例如:「硬币倾向于出现正面」或「药物确实有效」。

显著性水平 (Significance Level) \( (\alpha) \)

这是我们评估证据的「门槛」。通常我们使用 5% (0.05)1% (0.01)。这代表当我们拒绝原假设时,愿意承担「判断错误」的风险概率。百分比越小,我们所需要的证据就必须越强而有力!

重点复习框:
\(H_0\): 没有改变、没有影响(一律使用 \( = \) 符号)。
\(H_1\): 有所变化或出现影响(使用 \( < \)、\( > \) 或 \( \neq \))。
检验统计量 (Test Statistic): 我们从样本中实际得到的结果。

2. 单尾检验 vs. 双尾检验

我们如何撰写 \(H_1\) 取决于我们想寻找什么结果:

1. 单尾检验 (One-Tailed Test): 当我们怀疑变化是朝着特定方向时使用(例如:「平均值增加了」\( \mu > 10 \) 或「概率减少了」\( p < 0.5 \))。
2. 双尾检验 (Two-Tailed Test): 当我们认为情况已经改变,但不知道是变大还是变小时使用(例如:「平均值不再是 10」\( \mu \neq 10 \))。

记忆小撇步: 如果题目提到「增加」(increased) 或「减少」(decreased),那就是单尾检验。如果题目提到「改变」(changed) 或「不同」(is different),那就是双尾检验

3. 出错的可能:第一类错误与第二类错误

在统计学中,我们永远无法达到 100% 的确定性。这导致了两种「尴尬」的时刻:

第一类错误 (Type I Error): 在 \(H_0\) 其实是真的情况下,却拒绝了它。
类比:将一个无辜的人定罪。
第一类错误的概率正好等于显著性水平!

第二类错误 (Type II Error): 在 \(H_0\) 其实是假的情况下,却接受(未能拒绝)它。
类比:让一个有罪的人逍遥法外。

核心观念: 我们希望将这些错误保持在尽可能低的水平,但通常情况下,若要减少其中一种错误发生的概率,另一种错误发生的概率就会升高!

4. 比率检验 (二项分布)

当你面对的是「成功」与「失败」的二元结果时使用。例如,测试一枚骰子掷出 '6' 的概率是否比预期高。

步骤流程:

1. 列出 \(H_0\) 和 \(H_1\): 例如:\(H_0: p = 0.2\),\(H_1: p > 0.2\)。
2. 列出分布模型: 使用 \(H_0\) 中的 \(p\) 值,写出 \( X \sim B(n, p) \)。
3. 计算概率: 找出获得你观察到的结果或更极端结果的概率。如果你观察到 \(k\) 次成功,找出 \( P(X \geq k) \)。
4. 与 \(\alpha\) 比较:
• 如果概率 \( < \alpha \):拒绝 \(H_0\)(证据显示情况有变)。
• 如果概率 \( \geq \alpha \):不拒绝 \(H_0\)(证据不足)。

常犯错误: 当进行双尾检验时,你必须将显著性水平在两端各减半,或是将计算出的 p-value 加倍后再与 \(\alpha\) 比较!

5. 泊松分布的平均值检验

这适用于在时间或空间中发生的事件(例如一场球赛中的进球数或电线上的瑕疵点)。

若 \( X \sim Po(\lambda) \),我们检验的是速率 \( \lambda \)。
步骤与二项分布检验完全相同,但请使用泊松公式:\( P(X = r) = \frac{e^{-\lambda} \lambda^r}{r!} \)。

你知道吗? 如果你的泊松平均值 \( \lambda \) 很大(通常 \( > 15 \)),你可以使用正态分布近似法 (Normal Approximation) 来简化检验过程!

6. 正态分布的平均值检验

这是考试中最常见的题目之一。当我们知道总体方差 \( \sigma^2 \),但想检验平均值 \( \mu \) 是否改变时使用。

中心极限定理 (CLT) 提醒:

当我们抽取样本大小为 \(n\) 时,样本平均值 \( \bar{X} \) 会服从正态分布:
\( \bar{X} \sim N\left(\mu, \frac{\sigma^2}{n}\right) \)

如何计算检验统计量 (Z-score):

\( Z = \frac{\bar{x} - \mu}{\frac{\sigma}{\sqrt{n}}} \)

步骤:
1. 使用上述公式计算你的 Z值
2. 从统计表中根据给定的显著性水平找出临界值 (Critical Value)(例如:5% 单尾检验时为 1.645)。
3. 比较: 如果你的 Z值距离零比临界值更远,则拒绝 \(H_0\)

小提示: 永远画一张正态分布曲线的草图,并将「拒绝域」(Rejection Region,即尾部) 涂阴影。如果你的 Z-score 落入阴影区,\(H_0\) 就被「淘汰」了!

7. 总结清单

在你合上课本之前,请确认你已经做到:
• 能正确使用正确符号 (\(p, \lambda, \text{ 或 } \mu\)) 撰写 \(H_0\) 和 \(H_1\)。
• 能辨识检验是单尾还是双尾。
• 能计算二项分布和泊松分布检验的 p-value。
• 能计算正态检验的 Z-score 并与临界值进行比较。
• 能在题目背景下陈述你的结论(例如:「有 5% 水平的证据显示平均高度有所增加」)。

最后的鼓励: 假设检验不过是一个由数据支持的逻辑论证。熟练掌握这些步骤,你会发现这是考纲中最具规律性且容易拿高分的部分!你可以做到的!