簡介:什麼是假設檢定 (Hypothesis Test)?
歡迎!今天我們要來認識統計學中最強大的工具之一:假設檢定 (Hypothesis Testing)。別被這個名詞嚇到了——其實你在日常生活中天天都在用!
想像一下,你的朋友聲稱他能單靠味覺分辨出昂貴的瓶裝水和自來水。你對此半信半疑。為了「檢定」他的說法,你準備了幾杯水讓他喝。如果他全部猜對,你可能就開始相信他了;如果他猜錯了,你就會認為他的說法是假的。簡單來說,這就是假設檢定的核心概念。
在數學科 (XMA01) 中,我們運用這一套方法來判斷針對母體 (population) 的「聲稱」是否屬實,或者我們觀察到的現象是否只是隨機出現的巧合。
1. 假設檢定的術語
在開始運算之前,我們先來學習統計學中的「術語」。你可以把它想像成一場法庭審判。
虛無假設 (Null Hypothesis) \( (H_0) \)
虛無假設是我們的「預設立場」。在審判中,這就像是「未經證明有罪前,推定為無罪」。在數學中,我們假設現狀並未改變。我們記作 \(H_0\)。
例如:\(H_0: p = 0.5\)(這枚硬幣是公平的)。
對立假設 (Alternative Hypothesis) \( (H_1) \)
對立假設則是你想證明的事情,也就是你的「聲稱」。我們記作 \(H_1\)。
例如:\(H_1: p > 0.5\)(這枚硬幣有偏向正面出現的偏差)。
顯著性水平 (Significance Level) \( (\alpha) \)
這是我們證據的「門檻」。常見的數值為 5% (0.05) 或 1% (0.01)。這代表我們願意承擔犯錯的風險。如果觀察到的結果純屬巧合發生的機率低於這個水平,我們就會拒絕虛無假設。
檢定統計量 (Test Statistic)
這是我們收集到的數據證據。如果你擲硬幣 10 次,出現 9 次正面,那麼「9」就是你的檢定統計量。
快速複習:
- \(H_0\):現狀(沒有任何改變)。
- \(H_1\):新的聲稱(發生了改變)。
- 顯著性水平:我們的「證據門檻」。
2. 單尾檢定 (One-Tailed) 與雙尾檢定 (Two-Tailed)
根據我們想尋找的目標,檢定分為兩種「方向」。
單尾檢定
當聲稱明確指出了改變的方向時,我們使用單尾檢定。
- 「機率增加了」 \( (H_1: p > ...) \)
- 「機率減少了」 \( (H_1: p < ...) \)
雙尾檢定
當我們只想知道機率是否改變,但不確定是增加還是減少時,我們使用雙尾檢定。
- 「機率有所不同」 \( (H_1: p \neq ...) \)
- 小撇步:在雙尾檢定中,你必須將顯著性水平平分。如果是 5% 的檢定,你需要在上方找 2.5%,並在下方找 2.5%。
重點提示:一定要細心尋找題目中出現的關鍵字,如「大於」、「小於」或「改變」,來決定該用哪種檢定!
3. 步驟教學
如果剛開始覺得很難,不用擔心!只要每次都遵循以下這五個步驟,你就能輕鬆上手。
第一步:定義你的參數 (Parameter)。
寫下 \(p\) 代表什麼。
例如:設 \(p\) 為種子發芽的機率。
第二步:列出你的假設。
寫出你的 \(H_0\) 和 \(H_1\)。
第三步:寫出分配與顯著性水平。
通常在 S1/S2 中,這是二項分佈 (Binomial Distribution):\(X \sim B(n, p)\)。標明你的 \(\alpha\)(例如 5%)。
第四步:計算機率 (p-value)。
假設 \(H_0\) 為真,計算出你觀察到的結果(或比該結果更極端)的機率。
第五步:比較並作出結論。
- 如果你的機率小於顯著性水平:拒絕 \(H_0\) (Reject \(H_0\))。代表有足夠證據支持該聲稱。
- 如果你的機率大於顯著性水平:不拒絕 \(H_0\) (Do not reject \(H_0\))。代表證據不足。
4. 拒絕域 (Critical Regions) 與臨界值 (Critical Values)
有時候,我們不想針對單一結果去算 p-value,而是想找出「禁區」。
拒絕域 (Critical Region) 是指那些會導致我們拒絕虛無假設的檢定統計量數值範圍。
臨界值 (Critical Value) 則是劃分該區域的「邊界」數值。
比喻:想像籬笆上掛著「禁止進入」的牌子。籬笆就是臨界值,而籬笆後的整個區域就是拒絕域。
常見錯誤:在尋找二項分佈的拒絕域時,你必須選擇一個能將機率保持在顯著性水平以內的值。千萬不要超過 5%(或其他設定的水平)!
5. 實際應用範例
情境:有人認為一顆骰子偏向出現數字 6。擲了 20 次,數字 6 出現了 8 次。請以 5% 的顯著性水平進行檢定。
1. 參數:設 \(p\) 為擲出 6 的機率。在 \(H_0\) 下,\(p = 1/6\)。
2. 假設:\(H_0: p = 1/6\),\(H_1: p > 1/6\)。
3. 分配:\(X \sim B(20, 1/6)\),且 \(\alpha = 0.05\)。
4. 計算:我們需要 \(P(X \geq 8)\)。
使用查表法或計算機:\(P(X \geq 8) = 1 - P(X \leq 7) \approx 0.0102\)。
5. 結論:由於 \(0.0102\) (1.02%) 小於 0.05 (5%),我們拒絕 \(H_0\)。有顯著證據顯示該骰子偏向出現 6。
總結:黃金法則
- 務必在開頭定義 \(p\)。
- 務必在最終結論使用「有證據顯示 (evidence to suggest)」——永遠不要說你已經「證明 (proven)」了 100%。在統計學上,我們只會說有「強而有力的證據」。
- 對於雙尾檢定,記得將結果與 \(\alpha/2\) 進行比較。
- 如果機率很低,虛無假設就得走!(這是一個好記的口訣,用來提醒何時該拒絕 \(H_0\))。
你知道嗎?假設檢定主要由羅納德·費雪 (Ronald Fisher) 發展,他曾用一個實驗來檢定一位女士是否真的能分辨出奶茶是「先加奶」還是「先加茶」!(結果她真的做到了!)