Hypothesis tests - Mathematics (XMA01) - Pearson Edexcel International AS Level

簡介：什麼是假設檢定 (Hypothesis Test)？

歡迎！今天我們要來認識統計學中最強大的工具之一：假設檢定 (Hypothesis Testing)。別被這個名詞嚇到了——其實你在日常生活中天天都在用！

想像一下，你的朋友聲稱他能單靠味覺分辨出昂貴的瓶裝水和自來水。你對此半信半疑。為了「檢定」他的說法，你準備了幾杯水讓他喝。如果他全部猜對，你可能就開始相信他了；如果他猜錯了，你就會認為他的說法是假的。簡單來說，這就是假設檢定的核心概念。

在數學科 (XMA01) 中，我們運用這一套方法來判斷針對母體 (population) 的「聲稱」是否屬實，或者我們觀察到的現象是否只是隨機出現的巧合。

1. 假設檢定的術語

在開始運算之前，我們先來學習統計學中的「術語」。你可以把它想像成一場法庭審判。

虛無假設 (Null Hypothesis) \( (H_0) \)

虛無假設是我們的「預設立場」。在審判中，這就像是「未經證明有罪前，推定為無罪」。在數學中，我們假設現狀並未改變。我們記作 \(H_0\)。
例如：\(H_0: p = 0.5\)（這枚硬幣是公平的）。

對立假設 (Alternative Hypothesis) \( (H_1) \)

對立假設則是你想證明的事情，也就是你的「聲稱」。我們記作 \(H_1\)。
例如：\(H_1: p > 0.5\)（這枚硬幣有偏向正面出現的偏差）。

顯著性水平 (Significance Level) \( (\alpha) \)

這是我們證據的「門檻」。常見的數值為 5% (0.05) 或 1% (0.01)。這代表我們願意承擔犯錯的風險。如果觀察到的結果純屬巧合發生的機率低於這個水平，我們就會拒絕虛無假設。

檢定統計量 (Test Statistic)

這是我們收集到的數據證據。如果你擲硬幣 10 次，出現 9 次正面，那麼「9」就是你的檢定統計量。

快速複習：
- \(H_0\)：現狀（沒有任何改變）。
- \(H_1\)：新的聲稱（發生了改變）。
- 顯著性水平：我們的「證據門檻」。

2. 單尾檢定 (One-Tailed) 與雙尾檢定 (Two-Tailed)

根據我們想尋找的目標，檢定分為兩種「方向」。

單尾檢定

當聲稱明確指出了改變的方向時，我們使用單尾檢定。
- 「機率增加了」 \( (H_1: p > ...) \)
- 「機率減少了」 \( (H_1: p < ...) \)

雙尾檢定

當我們只想知道機率是否改變，但不確定是增加還是減少時，我們使用雙尾檢定。
- 「機率有所不同」 \( (H_1: p \neq ...) \)
- 小撇步：在雙尾檢定中，你必須將顯著性水平平分。如果是 5% 的檢定，你需要在上方找 2.5%，並在下方找 2.5%。

重點提示：一定要細心尋找題目中出現的關鍵字，如「大於」、「小於」或「改變」，來決定該用哪種檢定！

3. 步驟教學

如果剛開始覺得很難，不用擔心！只要每次都遵循以下這五個步驟，你就能輕鬆上手。

第一步：定義你的參數 (Parameter)。
寫下 \(p\) 代表什麼。
例如：設 \(p\) 為種子發芽的機率。

第二步：列出你的假設。
寫出你的 \(H_0\) 和 \(H_1\)。

第三步：寫出分配與顯著性水平。
通常在 S1/S2 中，這是二項分佈 (Binomial Distribution)：\(X \sim B(n, p)\)。標明你的 \(\alpha\)（例如 5%）。

第四步：計算機率 (p-value)。
假設 \(H_0\) 為真，計算出你觀察到的結果（或比該結果更極端）的機率。

第五步：比較並作出結論。
- 如果你的機率小於顯著性水平：拒絕 \(H_0\) (Reject \(H_0\))。代表有足夠證據支持該聲稱。
- 如果你的機率大於顯著性水平：不拒絕 \(H_0\) (Do not reject \(H_0\))。代表證據不足。

4. 拒絕域 (Critical Regions) 與臨界值 (Critical Values)

有時候，我們不想針對單一結果去算 p-value，而是想找出「禁區」。

拒絕域 (Critical Region) 是指那些會導致我們拒絕虛無假設的檢定統計量數值範圍。
臨界值 (Critical Value) 則是劃分該區域的「邊界」數值。

比喻：想像籬笆上掛著「禁止進入」的牌子。籬笆就是臨界值，而籬笆後的整個區域就是拒絕域。

常見錯誤：在尋找二項分佈的拒絕域時，你必須選擇一個能將機率保持在顯著性水平以內的值。千萬不要超過 5%（或其他設定的水平）！

5. 實際應用範例

情境：有人認為一顆骰子偏向出現數字 6。擲了 20 次，數字 6 出現了 8 次。請以 5% 的顯著性水平進行檢定。

1. 參數：設 \(p\) 為擲出 6 的機率。在 \(H_0\) 下，\(p = 1/6\)。
2. 假設：\(H_0: p = 1/6\)，\(H_1: p > 1/6\)。
3. 分配：\(X \sim B(20, 1/6)\)，且 \(\alpha = 0.05\)。
4. 計算：我們需要 \(P(X \geq 8)\)。
使用查表法或計算機：\(P(X \geq 8) = 1 - P(X \leq 7) \approx 0.0102\)。
5. 結論：由於 \(0.0102\) (1.02%) 小於 0.05 (5%)，我們拒絕 \(H_0\)。有顯著證據顯示該骰子偏向出現 6。

總結：黃金法則

- 務必在開頭定義 \(p\)。
- 務必在最終結論使用「有證據顯示 (evidence to suggest)」——永遠不要說你已經「證明 (proven)」了 100%。在統計學上，我們只會說有「強而有力的證據」。
- 對於雙尾檢定，記得將結果與 \(\alpha/2\) 進行比較。
- 如果機率很低，虛無假設就得走！(這是一個好記的口訣，用來提醒何時該拒絕 \(H_0\))。

你知道嗎？假設檢定主要由羅納德·費雪 (Ronald Fisher) 發展，他曾用一個實驗來檢定一位女士是否真的能分辨出奶茶是「先加奶」還是「先加茶」！(結果她真的做到了！)

* thinka提供的內容由AI生成，可能並非總是準確或最新。請將其用作輔助資源，並與官方材料進行核實。