简介:欢迎来到高等假设检验!

你好!在之前的学习中,你已经掌握了假设检验的基础知识——利用数据来判断关于总体的声称是否合理。这一章,我们将把这些技巧提升到更高层次。我们将探讨在结论中犯错的情况(误差)、处理不知道总体方差的情况(使用 t 分布),以及如何比较两组不同的数据以判断它们之间是否存在真实差异。

假设检验在现实世界中至关重要。无论是测试新药是否比旧药有效,还是检查工厂的机器校准是否正确,这些方法都能帮助我们在无法百分之百确定的情况下,做出科学的决策。让我们开始吧!


1. 第一类错误与第二类错误

假设检验并非完美。由于我们是利用样本去推断总体的真相,因此总会有小概率出错。我们将这些错误归纳为两类。

什么是第一类错误?

第一类错误 (Type I Error) 指的是当零假设 (\(H_0\)) 实际上为真,但我们却拒绝了它
你可以将其视为“假警报”。

类比:想象一下,当没有火灾时,烟雾报警器却响了。原本的“零假设”是“一切正常”,但报警器却拒绝了这个假设,大喊“有火灾!”,而事实上并没有。

关键点:犯下第一类错误的概率等于检验的显著性水平 (\(\alpha\))。如果你使用 5% 的显著性水平进行检验,那么你就有 5% 的概率犯下第一类错误。

什么是第二类错误?

第二类错误 (Type II Error) 指的是当零假设 (\(H_0\)) 实际上为假,但我们却无法拒绝它
你可以将其视为“错失真相”。

类比:想象厨房真的起火了,但烟雾报警器却毫无反应。它未能拒绝“一切正常”的假设,尽管事实上情况已经很不对了!

速查表:
第一类错误:当 \(H_0\) 为真时拒绝 \(H_0\)。(假警报)
第二类错误:当 \(H_1\) 为真时无法拒绝 \(H_0\)。(错失检测)


2. 学生 t 分布 (Student's t-distribution)

在基础统计学 (S1) 中,你可能使用正态分布 (\(Z\)) 来检验平均值。然而,使用正态分布的前提是必须知道总体方差 (\(\sigma^2\))。但在现实生活中,我们很少知道这个数值!

何时使用 t 分布?

当符合以下条件时,请使用 t 分布
1. 总体呈正态分布
2. 总体方差 (\(\sigma^2\)) 未知
3. 样本数 (\(n\)) 较小(虽然对于大样本也适用!)。

自由度 (\(\nu\))

t 分布的形状取决于称为自由度 (degrees of freedom) 的数值,以希腊字母 nu (\(\nu\)) 表示。对于单样本检验:
\( \nu = n - 1 \)

为什么是 \(n-1\)? 想象你有 3 个数字加起来必须等于 10。你可以任意选择前两个数字(它们是“自由”的),但第 3 个数字必须是特定数值才能凑成总和 10。因此你只有 2 个“自由度”。

检验统计量

要计算我们的检验值 (\(t\)),我们使用以下公式:
\( t = \frac{\bar{x} - \mu}{s / \sqrt{n}} \)
其中:
• \( \bar{x} \) 为样本平均值。
• \( \mu \) 为来自 \(H_0\) 的总体平均值。
• \( s \) 为标准差的无偏估计量
• \( n \) 为样本数。

别担心,这看起来可能有点复杂! 与正态分布检验的主要差异在于我们使用 \(s\) 代替 \(\sigma\),并根据正确的自由度在 t 分布表中查找临界值。


3. 两组平均值的差异检验

有时我们想比较两组不同的对象。例如:“听音乐学习的学生是否比在安静环境中学习的学生分数更高?”

独立样本(正态分布)

如果我们有两组独立样本且已知总体方差,我们检验平均值的差异 (\(\mu_1 - \mu_2\))。

假设设定:
\( H_0: \mu_1 = \mu_2 \) (两者无差异)
\( H_1: \mu_1 \neq \mu_2 \) (或 \( > \) 或 \( < \))

使用合并方差估计量 (\(s_p^2\))

如果我们不知道总体方差,但假设它们相等,我们两组样本的方差进行合并(Pool),以获得更佳的方差估计。

“合并”公式:
\( s_p^2 = \frac{(n_1 - 1)s_1^2 + (n_2 - 1)s_2^2}{n_1 + n_2 - 2} \)

一旦得到 \(s_p^2\),t 分布的检验统计量为:
\( t = \frac{(\bar{x}_1 - \bar{x}_2) - (\mu_1 - \mu_2)}{\sqrt{s_p^2 (\frac{1}{n_1} + \frac{1}{n_2})}} \)
此检验的自由度为:\( \nu = n_1 + n_2 - 2 \)。

重点总结:当比较两个方差未知但假设相等的群体时,请将它们“合并”以找出共用的方差,然后使用自由度为 \(n_1 + n_2 - 2\) 的 t 分布进行检验。


4. 常见错误避雷针

1. 混淆 \(z\) 和 \(t\):务必检查你是否已知总体方差 (\(\sigma^2\))。如果只有样本方差 (\(s^2\)),请务必使用 t 分布!

2. 自由度错误:对于单样本,自由度是 \(n-1\)。对于双样本(合并),自由度是 \(n_1 + n_2 - 2\)。查表前务必再三确认。

3. 显著性水平:仔细阅读题目,确认是单尾还是双尾检验。在双尾检验中,你必须将显著性水平平分(例如:5% 在两端各变为 2.5%)。


总结检查清单

考试前,请确认你能做到:
• 用文字定义第一类与第二类错误,并在情境中辨识它们。
• 说明使用 t 分布的条件。
• 计算方差的无偏估计量 \(s^2\)。
• 为双样本检验计算合并方差 \(s_p^2\)。
• 正确使用 t 分布表,并根据自由度 (\(\nu\)) 找到临界值。
• 透过比较检验统计量与临界值来得出结论,以问题的背景语境写出一句结论。

你一定可以的!统计学其实就是用数字来说故事。持续练习这些计算,规律自然就会变得清晰明了!