歡迎來到單元 S3:估計、置信區間與檢定!

在你之前的統計單元中,你處理的大多是已經給定的數據。在統計 3 (Statistics 3) 中,我們將會化身為現實世界的統計研究員。我們如何在不測量每個人的情況下,知道全國人口的平均身高?答案就是估計 (Estimate)。在本章中,你將學習如何僅利用一小部分樣本,對整個群體做出「精明的猜測」,以及如何對這些猜測保持信心。如果起初覺得公式很多,別擔心,我們會帶你一步步拆解!

1. 估計量與偏差

當我們想了解關於總體 (Population)(整個群體)的資訊時,我們會使用從樣本 (Sample)(群體的一小部分)計算出來的統計量 (Statistic)。這個統計量被稱為估計量 (Estimator)

關鍵術語:

  • 估計量 (Estimator):用於計算估計值的公式或方法(例如:樣本平均值公式)。
  • 估計值 (Estimate):將數據代入公式後得到的實際數字。
  • 偏差 (Bias):如果一個估計量的平均值等於真實的總體參數,我們稱之為無偏 (Unbiased)。想像一下向靶心投擲飛鏢;如果你沒有偏差,所有投擲點的「平均值」應該會剛好落在靶心上!

主要的無偏估計量:

1. 總體平均值 (\(\mu\)) 的無偏估計: 即樣本平均值,記作 \(\bar{x}\)。
\( \bar{x} = \frac{\sum x}{n} \)

2. 總體方差 (\(\sigma^2\)) 的無偏估計: 我們使用符號 \(s^2\) 來表示。
重要提示:為了使估計無偏,我們除以 \(n-1\) 而不是 \(n\)。這被稱為貝塞爾校正 (Bessel's Correction)。
\( s^2 = \frac{1}{n-1} \sum (x_i - \bar{x})^2 \) 或計算機更友好的版本:
\( s^2 = \frac{1}{n-1} \left( \sum x^2 - \frac{(\sum x)^2}{n} \right) \)

重點溫習:
如果題目給你一個樣本並要求方差的無偏估計,請務必檢查是否應該除以 \(n-1\)。如果數據已經以 \(S_{xx}\) 的形式總結,則 \(s^2 = \frac{S_{xx}}{n-1}\)。

2. 樣本平均值的分布

如果你從總體平均值為 \(\mu\)、方差為 \(\sigma^2\) 的群體中,反覆抽取許多大小為 \(n\) 的不同樣本,這些樣本平均值 (\(\bar{X}\)) 會形成它們自己的分布。

關鍵特性:
1. 樣本平均值的期望值等於總體平均值:\(E(\bar{X}) = \mu\)。
2. 樣本平均值的方差小於總體方差:\(Var(\bar{X}) = \frac{\sigma^2}{n}\)。
3. 標準誤 (Standard Error) 是此分布的標準差:\(\text{Standard Error} = \frac{\sigma}{\sqrt{n}}\)。

類比:城市中個人的身高差異很大(方差大)。但如果你將 50 人分為一組並找出每組的平均身高,這些平均值彼此會非常接近(方差/標準誤較小)。

核心結論:如果原始總體是常態分布 (Normal),則 \(\bar{X} \sim N(\mu, \frac{\sigma^2}{n})\)。

3. 常態平均值的置信區間

置信區間 (Confidence Interval, CI) 是一個數值範圍,我們有「相當把握」真實的總體平均值 \(\mu\) 落在該範圍內。

公式:
\( \bar{x} \pm z \left( \frac{\sigma}{\sqrt{n}} \right) \)

其中 \(z\) 是根據你的置信水平從常態分布表中取得的值:

  • 對於 90% 的置信區間,使用 \(z = 1.645\)
  • 對於 95% 的置信區間,使用 \(z = 1.960\)
  • 對於 99% 的置信區間,使用 \(z = 2.576\)

步驟流程:
1. 求出樣本平均值 \(\bar{x}\)。
2. 確定總體標準差 \(\sigma\)。(若未知且 \(n\) 很大,請使用 \(s\))。
3. 選擇對應百分比的正確 \(z\) 值。
4. 計算「誤差範圍 (error margin)」:\(z \times \frac{\sigma}{\sqrt{n}}\)。
5. 將區間寫成 \((\bar{x} - \text{error}, \bar{x} + \text{error})\) 的形式。

你知道嗎?
95% 的置信區間並不是指真實平均值有 95% 的機率落在該特定區間內。它的意思是,如果我們重複整個實驗 100 次,我們所計算出的 100 個區間中,有 95 個會包含真實的總體平均值。

4. 中央極限定理 (CLT)

這可以說是統計學中最強大的工具!
法則:如果樣本大小 \(n\) 很大(通常 \(n > 30\)),無論原始總體的分布看起來如何,樣本平均值 \(\bar{X}\) 的分布將會近似於常態分布 (Normal)

為什麼這很有用?
如果你要檢定一個偏態分布(如樓價或收入)的群體平均值,只要樣本夠大,你仍然可以使用常態分布的方法!

常見誤區:學生常以為 CLT 是指總體變成了常態分布。事實並非如此!它只說明了樣本平均值的分布變成了常態分布。

5. 平均值的假設檢定

我們利用這些檢定來檢查關於總體平均值的宣稱是否可能為真。

情況 A:單一平均值(方差已知)

我們檢定虛無假設 (null hypothesis) \(H_0: \mu = \mu_0\)。
檢定統計量 (Test Statistic) 為:
\( z = \frac{\bar{x} - \mu}{\sigma / \sqrt{n}} \)

情況 B:兩個平均值之差

如果我們想比較兩個獨立的組別(例如:「男生的成績是否高於女生?」),我們會觀察 \(\bar{X} - \bar{Y}\) 的差異。
假設組別是獨立的,檢定統計量為:
\( z = \frac{(\bar{x} - \bar{y}) - (\mu_x - \mu_y)}{\sqrt{\frac{\sigma_x^2}{n_x} + \frac{\sigma_y^2}{n_y}}} \)
通常在 \(H_0\) 下,我們假設平均值相等,即 \((\mu_x - \mu_y) = 0\)。

情況 C:大樣本(方差未知)

如果你不知道總體方差 \(\sigma^2\),但樣本很大 (\(n > 30\)),你可以直接用無偏樣本估計值 \(s^2\) 代替 \(\sigma^2\)。CLT 允許我們繼續使用 \(z\)-檢定!

檢定的關鍵要點:
- 如果 \(|z_{\text{calculated}}| > z_{\text{critical}}\),我們拒絕 \(H_0\)。這表示有顯著證據顯示平均值已經改變。
- 永遠記得在結論中寫出與題目背景相關的句子:「在 5% 的顯著水平下,有顯著證據顯示該種新肥料提高了植物的平均高度。」

總結清單

  • 我是否有使用 \(n-1\) 來計算方差的無偏估計?
  • 樣本大小是否足夠大 (\(n > 30\)) 以使用中央極限定理?
  • 我是否有將標準差除以 \(\sqrt{n}\) 以獲得標準誤?
  • 我的假設檢定是單尾(尋找增加/減少)還是雙尾(尋找任何變化)?
  • 我的最終答案是否已結合題目背景進行說明?

如果起初覺得這些很棘手,別擔心! 估計學的核心在於練習。一旦你認出哪些公式適用於「已知」或「未知」方差的情境,剩下的就只是細心的計算了。你一定做得到!