歡迎來到統計推論 (Statistical Inference)!

你有沒有想過,為什麼科學家只需測試幾百人,就能宣稱一種新藥有效?或者民調機構如何在選票點算完成前預測選舉結果?這就是統計推論的威力!

在本章中,我們將從單純的描述數據,進階到根據小樣本對整個總體進行「有根據的猜測」。別擔心,這聽起來像魔法,但其實全靠邏輯以及兩個非常特別的分佈:常態分佈 (Normal (Z) distribution)t 分佈 (t-distribution)

先備知識檢查:在開始之前,請記得平均值 (\(\mu\)) 代表平均數,而變異數 (\(\sigma^2\)) 則告訴我們數據的離散程度。如果你以前見過「鐘形曲線 (Bell Curve)」,那麼你已經成功了一半!


1. 大局觀:點估計 vs. 區間估計

如果我問你一個大南瓜有多重,你可能會給我一個數字(例如「50kg」),這就是點估計 (Point estimate)。但如果你想更可靠一點,你可能會說:「大概在 45kg 到 55kg 之間。」這就是區間估計 (Interval estimate)

在本課程中,我們使用樣本平均值 (\(\bar{x}\)) 作為總體平均值 (\(\mu\)) 的點估計。由於樣本並非完美,我們會在該平均值周圍建立一個置信區間 (Confidence Interval, CI),來表示我們對估計有多大的把握。


2. 「Z」與「t」的決策:我該用哪一個?

這是你在每一道考題中必須做出的最重要選擇。用錯了表格就會得出錯誤的答案!以下是一個簡單的判斷準則:

使用常態 (Z) 分佈,如果:

1. 你已知總體變異數 (\(\sigma^2\))。
2. 你不知道變異數,但樣本數量很大 (\(n \geq 30\))。在這種情況下,我們運用中央極限定理 (Central Limit Theorem),並使用樣本變異數 \(s^2\) 作為估計值。

使用 t 分佈,如果:

1. 你不知道總體變異數 (\(\sigma^2\))。
2. 你的樣本數量很小 (\(n < 30\))。
3. 關鍵條件:總體必須是常態分佈,t 檢定才會有效!

快速複習箱:
- 已知 \(\sigma^2\) \(\rightarrow\) Z
- 未知 \(\sigma^2\) + 大樣本 \(n\) \(\rightarrow\) Z
- 未知 \(\sigma^2\) + 小樣本 \(n\) \(\rightarrow\) t


3. 單一平均值的置信區間

置信區間為我們提供了一個範圍,我們相信真實的總體平均值就落在這裡。公式如下:

\(\bar{x} \pm (\text{臨界值 Critical Value}) \times \frac{s}{\sqrt{n}}\)

分步流程:
1. 求 \(\bar{x}\):你的樣本平均值。
2. 求 \(s^2\):總體變異數的不偏估計量(若題目未給出)。使用公式 \(s^2 = \frac{n}{n-1} \times (\text{樣本變異數})\)。
3. 求臨界值:
- 若使用 Z,請查閱常態分佈表中的百分比(例如 95% 對應 1.96)。
- 若使用 t,你需要自由度 (Degrees of Freedom, \(\nu = n - 1\))。在 t 分佈表中找到對應顯著水準的數值。
4. 計算誤差範圍 (Margin of Error):將臨界值乘以標準誤 (\(\frac{s}{\sqrt{n}}\))。
5. 寫出區間:(下界, 上界)。

例:如果你測量了 10 條巧克力棒,發現平均重量為 50g,且 \(s = 2\),那麼你的 t 檢定自由度為 \(10 - 1 = 9\)。

重點提示:99% 的置信區間會比 95% 的區間更寬,因為你想要「更有把握」,這意味著你需要一個更大的安全網!


4. 假設檢定:5 步邏輯

假設檢定就像一場法庭審判。我們預設「虛無假設 (\(H_0\))」是正確的(清白),直到我們有足夠的證據證明「對立假設 (\(H_1\))」(有罪)。

步驟如下:

1. 陳述假設:
- \(H_0: \mu = \text{數值}\)
- \(H_1: \mu \neq, <, \text{ 或 } > \text{數值}\)

2. 計算檢定統計量 (Test Statistic):
- 使用 Z:\(z = \frac{\bar{x} - \mu}{\sigma / \sqrt{n}}\)
- 使用 t:\(t = \frac{\bar{x} - \mu}{s / \sqrt{n}}\)

3. 確定臨界值或 p 值:
根據顯著水準(通常為 5% 或 1%)查表。

4. 比較:
如果你的計算結果距離零點比臨界值還遠,那麼這「不太可能」是由偶然造成的。

5. 結合情境下結論:
不要只寫「拒絕 \(H_0\)」。請寫:「有顯著的證據顯示巧克力棒的平均重量已經減少了。」


5. 比較兩個平均值(獨立樣本)

有時我們想知道兩組數據是否有差異——例如:「男生在這項測驗中的分數是否高於女生?」

為此,我們要觀察平均值的差異:\((\bar{x}_1 - \bar{x}_2)\)。

當兩組數據使用 t 分佈時:

在進階數學 9231 中,我們通常假設兩個總體具有相同的變異數。我們將它們合併 (pool) 以獲得合併估計量 (\(s_p^2\))

合併變異數公式:
\(s_p^2 = \frac{(n_1 - 1)s_1^2 + (n_2 - 1)s_2^2}{n_1 + n_2 - 2}\)

自由度:對於兩個樣本,\(\nu = n_1 + n_2 - 2\)。

常見錯誤:學生常忘記將兩個樣本數相加後再減去 2。請記住:兩個樣本,就要失去兩個自由度!


6. 配對樣本(「前後」檢定)

想像一下測試一種飲食療法。你測量了 10 個人的體重。這些並非獨立的群組;他們是同一個人!這就是配對樣本 t 檢定 (Matched Pairs t-test)

技巧:
1. 計算每個人的差值 (\(d\))(後減前)。
2. 將這些差值視為你的新單一樣本
3. 檢定這些差值的平均值 (\(\mu_d\)) 是否為零。
4. 使用 \(\nu = n - 1\),其中 \(n\) 為配對的數量。

你知道嗎?使用配對樣本檢定比獨立檢定更有效力,因為它忽略了人與人之間的差異,只關注每個人內部的變化。


7. 成功總結檢核表

- 檢查你的 \(n\):是小樣本還是大樣本?
- 檢查你的 \(\sigma^2\):是已知還是估計值?
- 陳述你的假設:若使用 t 檢定,一定要寫:「假設總體為常態分佈」。
- 確認尾數:是單尾檢定(例如「增加」)還是雙尾檢定(例如「改變」)?
- 情境最重要:一定要將最終答案與題目中提到的南瓜、巧克力棒或測驗分數聯繫起來!

如果起初覺得這些很困難,別擔心!統計推論就像學習一門新語言。一旦你掌握了「語法」(那 5 個步驟),「詞彙」(公式)就會開始變得完全合理且易於理解了。