歡迎來到連續隨機變量的世界!
在之前的學習中,你可能接觸過離散隨機變量 (Discrete Random Variables)——即那些可以數出來的數值,例如擲硬幣出現正面次數,或是班級人數。但如果我們測量身高、時間或重量呢?這些數值並不會「跳躍」地從一個整數變到另一個整數,而是沿著連續的標尺平滑變化。這就是連續隨機變量 (Continuous Random Variables)的世界。
在本章中,我們將重點探討全球最重要的連續分佈:正態分佈 (Normal Distribution)。掌握它就像拿到了一把「萬能鑰匙」,能助你打開統計學中許多難題的大門!
1. 離散與連續:有什麼區別?
在深入數學運算之前,我們先確保自己理解什麼是「連續」變量。
- 離散隨機變量: 具有特定、獨立的數值。例如:計算一場足球比賽的入球數(你不可能入 2.45 球)。
- 連續隨機變量: 在一定範圍內可以取任何數值。它們通常是測量結果。例如:你跑 100 米所需的時間(可能是 12 秒,12.1 秒,甚至 12.1045 秒)。
你知道嗎? 因為連續變量有無限多個可能的數值,所以該變量「剛好」等於某個特定數值(例如身高剛好是 1.750000... 米)的機率其實是零!因此,我們計算機率時,總是尋找數值落在某個範圍 (Range)內的機率。
2. 正態分佈:「鐘形曲線」
正態分佈是一種特殊的連續隨機變量。它用於模擬那些集中在平均值附近的現象,例如考試成績或樹葉的長度。
主要特徵:
- 對稱性: 左側是右側的鏡像。
- 鐘形: 大部分數據集中在中間,向兩端遞減。
- 平均值 (\(\mu\)): 這是曲線的中心點。
- 變異數 (\(\sigma^2\)): 它告訴我們鐘形曲線有多「分散」。
我們將其記為:\(X \sim N(\mu, \sigma^2)\)
例子:如果學生平均身高為 160cm,變異數為 25,我們寫成 \(X \sim N(160, 25)\)。注意:這裡的標準差 (\(\sigma\)) 是 \(\sqrt{25} = 5\)。
小貼士: 務必檢查題目給出的是變異數 (\(\sigma^2\))還是標準差 (\(\sigma\))。在公式 \(X \sim N(\mu, \sigma^2)\) 中,第二個數字永遠是變異數!
3. 標準化:使用 Z 分數
每一條正態曲線都不一樣(有的細高,有的扁寬)。為了求機率,我們需要將它們統一對比到一種「標準」版本,即標準正態分佈 (Standard Normal Distribution),它的平均值為 0,變異數為 1。
我們透過以下 Z 分數 (Z-score) 公式來實現:
\(Z = \frac{X - \mu}{\sigma}\)
比喻: 把 Z 分數想像成「萬能翻譯機」。就像你將不同的貨幣(美元、歐元、披索)兌換成黃金來比較價值一樣,我們將不同的正態變量轉換為 Z 分數來進行比較。
標準化步驟:
- 獲取你的數值 (\(X\))。
- 減去平均值 (\(\mu\))。
- 除以標準差 (\(\sigma\))。
剛開始覺得困難別擔心! 只要記住:Z 分數告訴你該數值距離平均值有幾個「標準差」。
4. 使用表格查找機率
一旦你有了 Z 分數,就可以使用正態分佈表 (Normal Distribution Table)來查找機率。表格會告訴你 Z 分數左側的面積,我們稱之為 \(\Phi(z)\)。
常見情況:
- 求 \(P(Z < a)\): 直接在表中查 \(a\)。
- 求 \(P(Z > a)\): 利用對稱性!總面積為 1,所以 \(P(Z > a) = 1 - \Phi(a)\)。
- 求 \(P(a < Z < b)\): 找到 \(b\) 左側的面積,減去 \(a\) 左側的面積。公式:\(\Phi(b) - \Phi(a)\)。
記憶口訣: 如果你需要右側的面積,必須用 1 減去該數值(Right = Remove from 1)。
5. 逆向問題:求 \(\mu\) 或 \(\sigma\)
有時題目會給你機率(面積),然後問你 \(X\)、平均值或標準差是多少。這就像「逆向操作」。
步驟流程:
- 畫一個鐘形曲線草圖,並標示出已知的面積。
- 由內向外查表,找到與該機率對應的 Z 分數。
- 將 Z、\(\mu\)、\(\sigma\) 代入公式 \(Z = \frac{X - \mu}{\sigma}\)。
- 解出缺少的變量。
常見錯誤: 如果面積在平均值的左側(小於 50%),你的 Z 分數必須是負數。表格通常只列出正的 Z 分數,所以你需要靈活運用對稱性!
6. 二項分佈的正態近似
有時我們會遇到二項分佈 (Binomial Distribution)(例如拋硬幣 1,000 次),但進行精確計算太難了。如果樣本量足夠大,二項分佈就會看起來像一條正態曲線!
什麼時候可以使用?
僅在以下情況可以使用正態近似:
- \(np > 5\)
- \(n(1-p) > 5\)(也寫作 \(nq > 5\))
如何計算:
- 計算平均值:\(\mu = np\)。
- 計算變異數:\(\sigma^2 = np(1-p)\)。
- 使用連續性修正 (Continuity Correction)(見下文)。
- 標準化並按慣常方法求機率。
7. 連續性修正:「0.5 法則」
當我們從離散變量(長條圖)轉向連續變量(平滑曲線)時,必須考慮數字之間的間隙。這就是連續性修正。
將每個離散數字想像成一個「區塊」,向兩側各延伸 0.5。例如,數字 10 實際上佔據了從 9.5 到 10.5 的空間。
如何調整:
- 若求 \(P(X \le 10)\),你需要包含 10 這個區塊,所以用 10.5。
- 若求 \(P(X < 10)\),你不包含 10,所以止於 9.5。
- 若求 \(P(X \ge 10)\),你從區塊的開頭開始,即 9.5。
- 若求 \(P(X > 10)\),你從區塊之後開始,即 10.5。
重點總結: 務必畫一條數線!如果你想包含該數字,就把邊界向外延伸 0.5;如果你想排除它,就把邊界向內退回 0.5。
複習清單
在參加考試前,請確保你能做到:
- 識別離散與連續變量的區別。
- 標準化任何數值,使用 \(Z = \frac{X - \mu}{\sigma}\)。
- 正確查閱正態分佈表(包括負 Z 分數的情況)。
- 逆向計算,從機率求出變量值。
- 檢查條件(\(np > 5\) 和 \(nq > 5\))以判斷是否能進行正態近似。
- 準確應用 0.5 的連續性修正。
你一定能做到! 統計學不過是一連串邏輯步驟的堆疊。一步一個腳印,多畫圖,答案自然會浮現。