實驗設計簡介
歡迎!在這一章,我們將探討統計學的「藍圖」。實驗設計(Experimental Design)是指對研究進行規劃,以確保收集到的數據盡可能可靠且準確的過程。無論你是在測試一款新的運動飲品還是一種醫療方案,如何設定測試方式與結果本身同樣重要。
這就像蓋房子一樣:如果地基不穩,整座房子可能會倒塌!讀完這些筆記後,你將學會如何構建一個「穩固」的實驗,從而避免偏差(bias)並減少誤差。
1. 實驗的核心要素
要進行一場公平的實驗,你需要掌握幾個關鍵概念,並能在考試中進行討論。
對照組與實驗組(Control and Experimental Groups)
想像一下,你想測試一種新的「超級生長」肥料對植物是否有效。你不能只是給十棵植物施肥就看它們長得如何。為什麼?因為植物本來就會長大!你需要一個基準來進行比較。
實驗組(Experimental Group):接受處理的一組(例如:使用「超級生長」肥料的植物)。
對照組(Control Group):處理方式完全相同,但不接受處理的一組(例如:只澆清水的植物)。
隨機化(Randomisation)
這是統計學家工具箱中最重要的工具之一。隨機化是指使用隨機機會(例如拋硬幣或使用隨機數產生器)將對象分配到各組中。這有助於確保在實驗開始前,各組之間盡可能相似,從而避免偏差。
例子:如果研究人員親自挑選看起來最健康的植物放入肥料組,實驗就不公平了。隨機分配能消除這種人為偏差。
重複(Replication)
單一結果可能只是巧合。重複是指在許多對象身上或多次重複進行實驗。我們擁有的對象越多(樣本量越大),我們就越能確信結果不是純屬運氣。
實驗誤差(Experimental Error)
別擔心,「誤差」並不一定意味著你做錯了什麼!在統計學中,實驗誤差是指數據中自然出現的差異。即使兩棵植物完全相同並澆同樣的水,它們的生長速度仍可能略有不同。我們設計的目標是將這種「背景噪音」降到最低。
快速回顧:「三大支柱」
1. 對照(Control):需要有一個比較的基準。
2. 隨機化(Randomisation):利用隨機性確保公平。
3. 重複(Replication):多次執行以驗證結果的真實性。
2. 盲法:保持客觀
有時,我們認為會發生的事情會影響結果。這在人類研究中尤其明顯。
單盲試驗(Blind Trials)
在單盲試驗中,受試者不知道自己身處哪一組。例如,在藥物試驗中,一個人服用真正的藥丸,另一個服用糖丸(即安慰劑,placebo),但兩者都不知道自己服用的是哪一種。這能防止「安慰劑效應」,即人們僅僅因為認為自己服用了藥物就感覺好轉。
雙盲試驗(Double-Blind Trials)
這是「黃金標準」。在雙盲試驗中,受試者和接觸他們的科研人員都不知道誰接受了哪種處理。這能防止研究人員無意間透露線索,或以有偏差的方式解釋結果。
類比:這就像汽水的「盲測」。如果你知道自己在喝昂貴的品牌,你可能會說服自己它更好喝!
3. 改進設計:區組化與配對(Blocking and Pairing)
如果我們知道有什麼因素可能會干擾結果(例如人的年齡或土壤類型),我們可以使用特定的設計來「抵銷」這些影響。
區組化(Blocking)
區組化是指在隨機化之前,將相似的對象分組。這些組別稱為區組(blocks)。這有助於減少實驗誤差,因為我們是在「同類之間」進行比較。
例子:如果你在測試跑鞋,你可以根據體能水平(初級、中級、專業)建立「區組」,因為體能絕對會影響跑步時間。
配對比較(Paired Comparisons)
配對比較是一種減少誤差的聰明方法。它涉及根據相似特徵(如同卵雙胞胎)將受試者兩兩配對,並讓其中一個接受一種處理,另一個接受另一種處理。
更棒的是,有時你可以直接用同一個人作為他自己的「配對對象」。
例子:測試兩款不同的防曬霜,在同一個人的左手臂塗抹防曬霜 A,右手臂塗抹防曬霜 B。這幾乎消除了所有「人與人之間」的差異!
4. 實驗設計的類型
你需要能夠區分這兩種主要的設置:
完全隨機設計(Completely Randomised Design)
這是最簡單的設置。你將所有受試者混在一起,然後隨機分配到各個組別。
優點:非常容易設置。
缺點:如果你的受試者差異很大(例如,有非常老的,也有非常年輕的),「運氣」可能會不小心讓所有老人分到同一組,從而破壞公平性。
隨機區組設計(Randomised Block Design)
首先,你將受試者分成不同的區組(相似的組別)。然後,在每個區組內,再隨機分配處理方式。
優點:準確性高得多,因為它確保了每種處理在各類受試者中都能得到公平測試。
缺點:組織起來較複雜。
關鍵點:
當你知道某個特定因素(如年齡、性別或體重)可能會影響結果時,請使用區組化。它有助於「過濾掉」該因素的影響,讓你看到處理本身的真實效果。
考試總結檢查清單
當題目要求你討論或評論一個實驗時,請檢查以下幾點:
● 是否進行了隨機化?如果沒有,請指出存在偏差的風險。
● 是否有對照組?如果沒有,我們怎麼知道變化真的是由處理引起的?
● 是否進行了重複?樣本量是否大到足以可靠?
● 是否可以採用盲法?如果涉及人類,他們通常應該對處理方式保持「盲目」。
● 是否應該使用區組化?確定是否有變量(如年齡或物種)應該先進行分組。
如果這部分看起來比數學密集的章節更囉唆,請別擔心!在 Paper 1 中,你解釋為什麼某個設計好壞的能力才是得分關鍵。只需不斷思考:「這個測試公平嗎?它能保持一致性嗎?」