Further hypothesis testing - Further Mathematics (9665) - Oxford AQA International AS Level

简介：欢迎来到高等假设检验！

你好！在之前的学习中，你已经掌握了假设检验的基础知识——利用数据来判断关于总体的声称是否合理。这一章，我们将把这些技巧提升到更高层次。我们将探讨在结论中犯错的情况（误差）、处理不知道总体方差的情况（使用 t 分布），以及如何比较两组不同的数据以判断它们之间是否存在真实差异。

假设检验在现实世界中至关重要。无论是测试新药是否比旧药有效，还是检查工厂的机器校准是否正确，这些方法都能帮助我们在无法百分之百确定的情况下，做出科学的决策。让我们开始吧！

1. 第一类错误与第二类错误

假设检验并非完美。由于我们是利用样本去推断总体的真相，因此总会有小概率出错。我们将这些错误归纳为两类。

什么是第一类错误？

第一类错误 (Type I Error) 指的是当零假设 (\(H_0\)) 实际上为真，但我们却拒绝了它。
你可以将其视为“假警报”。

类比：想象一下，当没有火灾时，烟雾报警器却响了。原本的“零假设”是“一切正常”，但报警器却拒绝了这个假设，大喊“有火灾！”，而事实上并没有。

关键点：犯下第一类错误的概率等于检验的显著性水平 (\(\alpha\))。如果你使用 5% 的显著性水平进行检验，那么你就有 5% 的概率犯下第一类错误。

什么是第二类错误？

第二类错误 (Type II Error) 指的是当零假设 (\(H_0\)) 实际上为假，但我们却无法拒绝它。
你可以将其视为“错失真相”。

类比：想象厨房真的起火了，但烟雾报警器却毫无反应。它未能拒绝“一切正常”的假设，尽管事实上情况已经很不对了！

速查表：
• 第一类错误：当 \(H_0\) 为真时拒绝 \(H_0\)。(假警报)
• 第二类错误：当 \(H_1\) 为真时无法拒绝 \(H_0\)。(错失检测)

2. 学生 t 分布 (Student's t-distribution)

在基础统计学 (S1) 中，你可能使用正态分布 (\(Z\)) 来检验平均值。然而，使用正态分布的前提是必须知道总体方差 (\(\sigma^2\))。但在现实生活中，我们很少知道这个数值！

何时使用 t 分布？

当符合以下条件时，请使用 t 分布：
1. 总体呈正态分布。
2. 总体方差 (\(\sigma^2\)) 未知。
3. 样本数 (\(n\)) 较小（虽然对于大样本也适用！）。

自由度 (\(\nu\))

t 分布的形状取决于称为自由度 (degrees of freedom) 的数值，以希腊字母 nu (\(\nu\)) 表示。对于单样本检验：
\( \nu = n - 1 \)

为什么是 \(n-1\)？ 想象你有 3 个数字加起来必须等于 10。你可以任意选择前两个数字（它们是“自由”的），但第 3 个数字必须是特定数值才能凑成总和 10。因此你只有 2 个“自由度”。

检验统计量

要计算我们的检验值 (\(t\))，我们使用以下公式：
\( t = \frac{\bar{x} - \mu}{s / \sqrt{n}} \)
其中：
• \( \bar{x} \) 为样本平均值。
• \( \mu \) 为来自 \(H_0\) 的总体平均值。
• \( s \) 为标准差的无偏估计量。
• \( n \) 为样本数。

别担心，这看起来可能有点复杂！ 与正态分布检验的主要差异在于我们使用 \(s\) 代替 \(\sigma\)，并根据正确的自由度在 t 分布表中查找临界值。

3. 两组平均值的差异检验

有时我们想比较两组不同的对象。例如：“听音乐学习的学生是否比在安静环境中学习的学生分数更高？”

独立样本（正态分布）

如果我们有两组独立样本且已知总体方差，我们检验平均值的差异 (\(\mu_1 - \mu_2\))。

假设设定：
\( H_0: \mu_1 = \mu_2 \) (两者无差异)
\( H_1: \mu_1 \neq \mu_2 \) (或 \( > \) 或 \( < \))

使用合并方差估计量 (\(s_p^2\))

如果我们不知道总体方差，但假设它们相等，我们两组样本的方差进行合并（Pool），以获得更佳的方差估计。

“合并”公式：
\( s_p^2 = \frac{(n_1 - 1)s_1^2 + (n_2 - 1)s_2^2}{n_1 + n_2 - 2} \)

一旦得到 \(s_p^2\)，t 分布的检验统计量为：
\( t = \frac{(\bar{x}_1 - \bar{x}_2) - (\mu_1 - \mu_2)}{\sqrt{s_p^2 (\frac{1}{n_1} + \frac{1}{n_2})}} \)
此检验的自由度为：\( \nu = n_1 + n_2 - 2 \)。

重点总结：当比较两个方差未知但假设相等的群体时，请将它们“合并”以找出共用的方差，然后使用自由度为 \(n_1 + n_2 - 2\) 的 t 分布进行检验。

4. 常见错误避雷针

1. 混淆 \(z\) 和 \(t\)：务必检查你是否已知总体方差 (\(\sigma^2\))。如果只有样本方差 (\(s^2\))，请务必使用 t 分布！

2. 自由度错误：对于单样本，自由度是 \(n-1\)。对于双样本（合并），自由度是 \(n_1 + n_2 - 2\)。查表前务必再三确认。

3. 显著性水平：仔细阅读题目，确认是单尾还是双尾检验。在双尾检验中，你必须将显著性水平平分（例如：5% 在两端各变为 2.5%）。

总结检查清单

考试前，请确认你能做到：
• 用文字定义第一类与第二类错误，并在情境中辨识它们。
• 说明使用 t 分布的条件。
• 计算方差的无偏估计量 \(s^2\)。
• 为双样本检验计算合并方差 \(s_p^2\)。
• 正确使用 t 分布表，并根据自由度 (\(\nu\)) 找到临界值。
• 透过比较检验统计量与临界值来得出结论，并以问题的背景语境写出一句结论。

你一定可以的！统计学其实就是用数字来说故事。持续练习这些计算，规律自然就会变得清晰明了！

* thinka提供的内容由AI生成，可能并非总是准确或最新。请将其用作辅助资源，并与官方材料进行核实。