Inference using normal and t-distributions - Mathematics - Further (9231) - Cambridge International AS Level

歡迎來到統計推論 (Statistical Inference)！

你有沒有想過，為什麼科學家只需測試幾百人，就能宣稱一種新藥有效？或者民調機構如何在選票點算完成前預測選舉結果？這就是統計推論的威力！

在本章中，我們將從單純的描述數據，進階到根據小樣本對整個總體進行「有根據的猜測」。別擔心，這聽起來像魔法，但其實全靠邏輯以及兩個非常特別的分佈：常態分佈 (Normal (Z) distribution) 和 t 分佈 (t-distribution)。

先備知識檢查：在開始之前，請記得平均值 (\(\mu\)) 代表平均數，而變異數 (\(\sigma^2\)) 則告訴我們數據的離散程度。如果你以前見過「鐘形曲線 (Bell Curve)」，那麼你已經成功了一半！

1. 大局觀：點估計 vs. 區間估計

如果我問你一個大南瓜有多重，你可能會給我一個數字（例如「50kg」），這就是點估計 (Point estimate)。但如果你想更可靠一點，你可能會說：「大概在 45kg 到 55kg 之間。」這就是區間估計 (Interval estimate)。

在本課程中，我們使用樣本平均值 (\(\bar{x}\)) 作為總體平均值 (\(\mu\)) 的點估計。由於樣本並非完美，我們會在該平均值周圍建立一個置信區間 (Confidence Interval, CI)，來表示我們對估計有多大的把握。

2. 「Z」與「t」的決策：我該用哪一個？

這是你在每一道考題中必須做出的最重要選擇。用錯了表格就會得出錯誤的答案！以下是一個簡單的判斷準則：

使用常態 (Z) 分佈，如果：

1. 你已知總體變異數 (\(\sigma^2\))。
2. 你不知道變異數，但樣本數量很大 (\(n \geq 30\))。在這種情況下，我們運用中央極限定理 (Central Limit Theorem)，並使用樣本變異數 \(s^2\) 作為估計值。

使用 t 分佈，如果：

1. 你不知道總體變異數 (\(\sigma^2\))。
2. 你的樣本數量很小 (\(n < 30\))。
3. 關鍵條件：總體必須是常態分佈，t 檢定才會有效！

快速複習箱：
- 已知 \(\sigma^2\) \(\rightarrow\) Z
- 未知 \(\sigma^2\) + 大樣本 \(n\) \(\rightarrow\) Z
- 未知 \(\sigma^2\) + 小樣本 \(n\) \(\rightarrow\) t

3. 單一平均值的置信區間

置信區間為我們提供了一個範圍，我們相信真實的總體平均值就落在這裡。公式如下：

\(\bar{x} \pm (\text{臨界值 Critical Value}) \times \frac{s}{\sqrt{n}}\)

分步流程：
1. 求 \(\bar{x}\)：你的樣本平均值。
2. 求 \(s^2\)：總體變異數的不偏估計量（若題目未給出）。使用公式 \(s^2 = \frac{n}{n-1} \times (\text{樣本變異數})\)。
3. 求臨界值：
- 若使用 Z，請查閱常態分佈表中的百分比（例如 95% 對應 1.96）。
- 若使用 t，你需要自由度 (Degrees of Freedom, \(\nu = n - 1\))。在 t 分佈表中找到對應顯著水準的數值。
4. 計算誤差範圍 (Margin of Error)：將臨界值乘以標準誤 (\(\frac{s}{\sqrt{n}}\))。
5. 寫出區間：(下界, 上界)。

例：如果你測量了 10 條巧克力棒，發現平均重量為 50g，且 \(s = 2\)，那麼你的 t 檢定自由度為 \(10 - 1 = 9\)。

重點提示：99% 的置信區間會比 95% 的區間更寬，因為你想要「更有把握」，這意味著你需要一個更大的安全網！

4. 假設檢定：5 步邏輯

假設檢定就像一場法庭審判。我們預設「虛無假設 (\(H_0\))」是正確的（清白），直到我們有足夠的證據證明「對立假設 (\(H_1\))」（有罪）。

步驟如下：

1. 陳述假設：
- \(H_0: \mu = \text{數值}\)
- \(H_1: \mu \neq, <, \text{ 或 } > \text{數值}\)

2. 計算檢定統計量 (Test Statistic)：
- 使用 Z：\(z = \frac{\bar{x} - \mu}{\sigma / \sqrt{n}}\)
- 使用 t：\(t = \frac{\bar{x} - \mu}{s / \sqrt{n}}\)

3. 確定臨界值或 p 值：
根據顯著水準（通常為 5% 或 1%）查表。

4. 比較：
如果你的計算結果距離零點比臨界值還遠，那麼這「不太可能」是由偶然造成的。

5. 結合情境下結論：
不要只寫「拒絕 \(H_0\)」。請寫：「有顯著的證據顯示巧克力棒的平均重量已經減少了。」

5. 比較兩個平均值（獨立樣本）

有時我們想知道兩組數據是否有差異——例如：「男生在這項測驗中的分數是否高於女生？」

為此，我們要觀察平均值的差異：\((\bar{x}_1 - \bar{x}_2)\)。

當兩組數據使用 t 分佈時：

在進階數學 9231 中，我們通常假設兩個總體具有相同的變異數。我們將它們合併 (pool) 以獲得合併估計量 (\(s_p^2\))。

合併變異數公式：
\(s_p^2 = \frac{(n_1 - 1)s_1^2 + (n_2 - 1)s_2^2}{n_1 + n_2 - 2}\)

自由度：對於兩個樣本，\(\nu = n_1 + n_2 - 2\)。

常見錯誤：學生常忘記將兩個樣本數相加後再減去 2。請記住：兩個樣本，就要失去兩個自由度！

6. 配對樣本（「前後」檢定）

想像一下測試一種飲食療法。你測量了 10 個人前和後的體重。這些並非獨立的群組；他們是同一個人！這就是配對樣本 t 檢定 (Matched Pairs t-test)。

技巧：
1. 計算每個人的差值 (\(d\))（後減前）。
2. 將這些差值視為你的新單一樣本。
3. 檢定這些差值的平均值 (\(\mu_d\)) 是否為零。
4. 使用 \(\nu = n - 1\)，其中 \(n\) 為配對的數量。

你知道嗎？使用配對樣本檢定比獨立檢定更有效力，因為它忽略了人與人之間的差異，只關注每個人內部的變化。

7. 成功總結檢核表

- 檢查你的 \(n\)：是小樣本還是大樣本？
- 檢查你的 \(\sigma^2\)：是已知還是估計值？
- 陳述你的假設：若使用 t 檢定，一定要寫：「假設總體為常態分佈」。
- 確認尾數：是單尾檢定（例如「增加」）還是雙尾檢定（例如「改變」）？
- 情境最重要：一定要將最終答案與題目中提到的南瓜、巧克力棒或測驗分數聯繫起來！

如果起初覺得這些很困難，別擔心！統計推論就像學習一門新語言。一旦你掌握了「語法」（那 5 個步驟），「詞彙」（公式）就會開始變得完全合理且易於理解了。

* thinka提供的內容由AI生成，可能並非總是準確或最新。請將其用作輔助資源，並與官方材料進行核實。