欢迎来到“拟合度检验与列联表”的世界!
你有没有想过,一颗“随机”的骰子是否真的公平?或者你最喜欢的零食品牌是否真的在每一包里都放了同样份量的巧克力?在 Unit S3 的这一章,我们将学习如何运用 卡方 (\(\chi^2\)) 检验,来比较我们在现实中观察到的数据(观察值 Observed)与数学模型预测的结果(期望值 Expected)。这就是为了看看模型与现实到底“吻合”得有多好!
1. 核心概念:\(\chi^2\) 检验
本章的核心是拟合度检验 (Goodness of Fit test)。我们使用一个特定的公式来计算一个“检验统计量”。你可以把这个统计量想象成一个分数,用来衡量你的观察结果与数学模型的预测目标“偏离”了多少。
公式
\(\chi^2\) 统计量的公式如下:
\( \chi^2 = \sum \frac{(O_i - E_i)^2}{E_i} \)
其中:
• \(O_i\) 是 观察频数 (Observed frequency)(实际发生的次数)。
• \(E_i\) 是 期望频数 (Expected frequency)(模型预测的次数)。
如何解读这个分数
• 如果 \(\chi^2\) 的值很小,代表观察值与期望值非常接近。这意味着模型 拟合度良好 (Good Fit)。
• 如果 \(\chi^2\) 的值很大,代表现实与模型之间存在巨大差距。这意味着模型 拟合度较差 (Poor Fit)。
快速复习区
\(H_0\)(虚无假设/零假设): 数据符合指定的分配(例如:“这颗骰子是公平的”)。
\(H_1\)(对立假设/备择假设): 数据不符合指定的分配(例如:“这颗骰子是有偏差的”)。
重点总结: 我们是在测量观察值与期望值之间的“距离”。如果这个距离太大,我们就要拒绝这个模型!
2. “五之规则”与合并组别
如果数学看起来有点繁琐也不用担心;\(\chi^2\) 检验中有一个非常重要的“黄金法则”:期望频数 (\(E_i\)) 必须至少为 5。
如果期望频数小于 5,\(\chi^2\) 检验的结果就会不可靠。为了修正这一点,我们需要合并相邻的组别,直到新的“合并后”期望频数达到 5 或以上。
例子:如果你正在测试一颗骰子,而掷出“6”的期望频数只有 3,你可能需要将“5”和“6”的类别合并为一个“5 或 6”的类别。常见错误: 学生往往会去看 观察值 (\(O\)) 是否小于 5。停! 记得,这条规则只针对 期望值 (\(E\))。
3. 计算期望频数
根据你正在测试的分配,计算 \(E_i\) 的方法也会不同。课程大纲主要涵盖以下几种类型:
A. 离散均匀分配 (Discrete Uniform Distribution)
这是最简单的!如果所有情况发生的机率都相等(例如公平的骰子),那么:
\( E_i = \frac{\text{总频数}}{\text{类别总数}} \)
B. 二项分布与泊松分布 (Binomial and Poisson Distributions)
你需要使用在 S2 学过的概率公式:
\( E_i = P(X = i) \times \text{总频数} \)
重要提示: 如果你必须从数据中估计参数(例如泊松的平均值 \(\lambda\) 或二项分布的概率 \(p\)),因为这些参数不是题目给定的,这将影响后面的“自由度”!
C. 常态分布与连续均匀分配 (Normal and Continuous Uniform Distributions)
对于连续性数据,你需要计算落入某个 范围(组距)的概率,然后乘以总频数。
你知道吗? 在医学界,我们也会利用 \(\chi^2\) 检验来验证新药的副作用是否与临床试验预测的结果相符!
4. 自由度 (\(v\))
自由度 (Degrees of Freedom)(用希腊字母 \(\nu\) 或直接用 \(v\) 表示)决定了我们应该查阅课本附表中的哪一条 \(\chi^2\) 分配曲线。
通用规则:
\( v = n - 1 - c \)
其中:
• \(n\) 是合并之后的组别数量。
• \(1\) 是因为总频数必须相等,所以总是需要减去 1。
• \(c\) 是 估计参数的数量。
需要减去多少参数 (\(c\))?
• 离散均匀分配: \(c = 0\)(没有参数需要估计)。
• 泊松分布: \(c = 1\)(如果你需要计算 \(\lambda = \text{平均值}\))。
• 二项分布: \(c = 1\)(如果你需要计算 \(p\))。
• 常态分布: \(c = 2\)(如果你需要同时计算 \(\mu\) 和 \(\sigma^2\))。
重点总结: 务必先根据“五之规则”合并组别,计算出合并后的 \(n\),减去 1,再减去你自己估计的参数数量。
5. 列联表 (Contingency Tables)
有时候我们想知道两个变量是否独立 (independent)。例如:“你最喜欢的颜色与性别是否有关系?”这时我们就会用到 列联表。
逐步教学:寻找期望频数
在列联表中,你可以利用“行列总和”规则来计算每个单元格的期望值:
\( E = \frac{\text{列总和} \times \text{行总和}}{\text{总计}} \)
列联表的自由度
对于一个 \(r\) 行 \(c\) 列的表格:
\( v = (r - 1) \times (c - 1) \)
快速复习:列联表的假设
\(H_0\): 两个变量之间 没有关联(它们是独立的)。
\(H_1\): 两个变量之间 有关联(它们是相关的)。
如果觉得这部分很复杂也不用担心! 只要记住:
1. 计算每一行和每一列的总和。
2. 对每个单元格套用行列公式计算 \(E\)。
3. 像之前一样套用 \(\sum \frac{(O-E)^2}{E}\) 公式即可!
6. 检验流程总结
想要在考试中取得好成绩,请每次都遵循以下步骤:
- 清楚写出你的 虚无假设 (\(H_0\)) 和 对立假设 (\(H_1\))。
- 计算 期望频数 (\(E\))。
- 检查 五之规则:如果任何 \(E < 5\),则合并组别。
- 利用 \( \sum \frac{(O-E)^2}{E} \) 计算你的 检验统计量。
- 决定 自由度 (\(v\))。
- 根据题目给定的显著性水平(例如 5%),从课本的 \(\chi^2\) 表中找出 临界值 (critical value)。
- 比较与结论: 如果你的计算值 大于 临界值,则 拒绝 \(H_0\)。
最后鼓励: 你做得到的!只要按部就班就好。最常见的错误就是忘记合并组别,或是算错了自由度。只要确认这两点,你就能成为 \(\chi^2\) 大师!