Estimation, confidence intervals and tests - Further Mathematics (XFM01) - Pearson Edexcel International AS Level

歡迎來到單元 S3：估計、置信區間與檢定！

在你之前的統計單元中，你處理的大多是已經給定的數據。在統計 3 (Statistics 3) 中，我們將會化身為現實世界的統計研究員。我們如何在不測量每個人的情況下，知道全國人口的平均身高？答案就是估計 (Estimate)。在本章中，你將學習如何僅利用一小部分樣本，對整個群體做出「精明的猜測」，以及如何對這些猜測保持信心。如果起初覺得公式很多，別擔心，我們會帶你一步步拆解！

1. 估計量與偏差

當我們想了解關於總體 (Population)（整個群體）的資訊時，我們會使用從樣本 (Sample)（群體的一小部分）計算出來的統計量 (Statistic)。這個統計量被稱為估計量 (Estimator)。

關鍵術語：

估計量 (Estimator)：用於計算估計值的公式或方法（例如：樣本平均值公式）。
估計值 (Estimate)：將數據代入公式後得到的實際數字。
偏差 (Bias)：如果一個估計量的平均值等於真實的總體參數，我們稱之為無偏 (Unbiased)。想像一下向靶心投擲飛鏢；如果你沒有偏差，所有投擲點的「平均值」應該會剛好落在靶心上！

主要的無偏估計量：

1. 總體平均值 (\(\mu\)) 的無偏估計： 即樣本平均值，記作 \(\bar{x}\)。
\( \bar{x} = \frac{\sum x}{n} \)

2. 總體方差 (\(\sigma^2\)) 的無偏估計： 我們使用符號 \(s^2\) 來表示。
重要提示：為了使估計無偏，我們除以 \(n-1\) 而不是 \(n\)。這被稱為貝塞爾校正 (Bessel's Correction)。
\( s^2 = \frac{1}{n-1} \sum (x_i - \bar{x})^2 \) 或計算機更友好的版本：
\( s^2 = \frac{1}{n-1} \left( \sum x^2 - \frac{(\sum x)^2}{n} \right) \)

重點溫習：
如果題目給你一個樣本並要求方差的無偏估計，請務必檢查是否應該除以 \(n-1\)。如果數據已經以 \(S_{xx}\) 的形式總結，則 \(s^2 = \frac{S_{xx}}{n-1}\)。

2. 樣本平均值的分布

如果你從總體平均值為 \(\mu\)、方差為 \(\sigma^2\) 的群體中，反覆抽取許多大小為 \(n\) 的不同樣本，這些樣本平均值 (\(\bar{X}\)) 會形成它們自己的分布。

關鍵特性：
1. 樣本平均值的期望值等於總體平均值：\(E(\bar{X}) = \mu\)。
2. 樣本平均值的方差小於總體方差：\(Var(\bar{X}) = \frac{\sigma^2}{n}\)。
3. 標準誤 (Standard Error) 是此分布的標準差：\(\text{Standard Error} = \frac{\sigma}{\sqrt{n}}\)。

類比：城市中個人的身高差異很大（方差大）。但如果你將 50 人分為一組並找出每組的平均身高，這些平均值彼此會非常接近（方差/標準誤較小）。

核心結論：如果原始總體是常態分布 (Normal)，則 \(\bar{X} \sim N(\mu, \frac{\sigma^2}{n})\)。

3. 常態平均值的置信區間

置信區間 (Confidence Interval, CI) 是一個數值範圍，我們有「相當把握」真實的總體平均值 \(\mu\) 落在該範圍內。

公式：
\( \bar{x} \pm z \left( \frac{\sigma}{\sqrt{n}} \right) \)

其中 \(z\) 是根據你的置信水平從常態分布表中取得的值：

對於 90% 的置信區間，使用 \(z = 1.645\)
對於 95% 的置信區間，使用 \(z = 1.960\)
對於 99% 的置信區間，使用 \(z = 2.576\)

步驟流程：
1. 求出樣本平均值 \(\bar{x}\)。
2. 確定總體標準差 \(\sigma\)。（若未知且 \(n\) 很大，請使用 \(s\)）。
3. 選擇對應百分比的正確 \(z\) 值。
4. 計算「誤差範圍 (error margin)」：\(z \times \frac{\sigma}{\sqrt{n}}\)。
5. 將區間寫成 \((\bar{x} - \text{error}, \bar{x} + \text{error})\) 的形式。

你知道嗎？
95% 的置信區間並不是指真實平均值有 95% 的機率落在該特定區間內。它的意思是，如果我們重複整個實驗 100 次，我們所計算出的 100 個區間中，有 95 個會包含真實的總體平均值。

4. 中央極限定理 (CLT)

這可以說是統計學中最強大的工具！
法則：如果樣本大小 \(n\) 很大（通常 \(n > 30\)），無論原始總體的分布看起來如何，樣本平均值 \(\bar{X}\) 的分布將會近似於常態分布 (Normal)。

為什麼這很有用？
如果你要檢定一個偏態分布（如樓價或收入）的群體平均值，只要樣本夠大，你仍然可以使用常態分布的方法！

常見誤區：學生常以為 CLT 是指總體變成了常態分布。事實並非如此！它只說明了樣本平均值的分布變成了常態分布。

5. 平均值的假設檢定

我們利用這些檢定來檢查關於總體平均值的宣稱是否可能為真。

情況 A：單一平均值（方差已知）

我們檢定虛無假設 (null hypothesis) \(H_0: \mu = \mu_0\)。
檢定統計量 (Test Statistic) 為：
\( z = \frac{\bar{x} - \mu}{\sigma / \sqrt{n}} \)

情況 B：兩個平均值之差

如果我們想比較兩個獨立的組別（例如：「男生的成績是否高於女生？」），我們會觀察 \(\bar{X} - \bar{Y}\) 的差異。
假設組別是獨立的，檢定統計量為：
\( z = \frac{(\bar{x} - \bar{y}) - (\mu_x - \mu_y)}{\sqrt{\frac{\sigma_x^2}{n_x} + \frac{\sigma_y^2}{n_y}}} \)
通常在 \(H_0\) 下，我們假設平均值相等，即 \((\mu_x - \mu_y) = 0\)。

情況 C：大樣本（方差未知）

如果你不知道總體方差 \(\sigma^2\)，但樣本很大 (\(n > 30\))，你可以直接用無偏樣本估計值 \(s^2\) 代替 \(\sigma^2\)。CLT 允許我們繼續使用 \(z\)-檢定！

檢定的關鍵要點：
- 如果 \(|z_{\text{calculated}}| > z_{\text{critical}}\)，我們拒絕 \(H_0\)。這表示有顯著證據顯示平均值已經改變。
- 永遠記得在結論中寫出與題目背景相關的句子：「在 5% 的顯著水平下，有顯著證據顯示該種新肥料提高了植物的平均高度。」

總結清單

我是否有使用 \(n-1\) 來計算方差的無偏估計？
樣本大小是否足夠大 (\(n > 30\)) 以使用中央極限定理？
我是否有將標準差除以 \(\sqrt{n}\) 以獲得標準誤？
我的假設檢定是單尾（尋找增加/減少）還是雙尾（尋找任何變化）？
我的最終答案是否已結合題目背景進行說明？

如果起初覺得這些很棘手，別擔心！ 估計學的核心在於練習。一旦你認出哪些公式適用於「已知」或「未知」方差的情境，剩下的就只是細心的計算了。你一定做得到！

* thinka提供的內容由AI生成，可能並非總是準確或最新。請將其用作輔助資源，並與官方材料進行核實。