歡迎來到機率生成函數(Probability Generating Functions)的世界!

在本章中,我們將學習一個非常聰明的工具,稱為機率生成函數(簡稱 PGF)。別讓這個名稱嚇到了!你可以把 PGF 想像成一個「數學背包」或「DNA 序列」,它將離散隨機變數的所有資訊都封裝在一個簡潔的代數式中。

如果你曾經覺得計算複雜分佈的平均值和變異數很繁瑣,你一定會愛上 PGF。它們利用微積分的威力,能讓這些計算變得快得多。讓我們開始吧!

1. 到底什麼是 PGF?

離散隨機變數 \(X\) 的機率生成函數是一個冪級數,其中機率是虛變數(通常為 \(t\))的係數。

其正式定義為:
\(G_X(t) = E(t^X) = \sum P(X = x)t^x\)

拆解來看:
如果 \(X\) 可以取值 0, 1, 2, 3...,其機率分別為 \(p_0, p_1, p_2, p_3...\),那麼:
\(G_X(t) = p_0 + p_1t^1 + p_2t^2 + p_3t^3 + ...\)

生活化類比:
想像你有一堆盒子。0 號盒子裝著 \(X=0\) 的機率,1 號盒子裝著 \(X=1\) 的機率,依此類推。變數 \(t^x\) 只是盒子上的標籤,讓我們知道哪個機率對應到 \(X\) 的哪個值。整個函數就像是一個把所有盒子整齊擺放的「架子」!

快速回顧:機率之和

由於分佈中所有機率之和必須等於 1,因此如果將 \(t = 1\) 代入任何 PGF,結果永遠會是 1。
重點: \(G_X(1) = 1\)。

2. 常見分佈的 PGF

你不需要每次都從零開始構建 PGF。對於課程大綱中的常見分佈,PGF 都有特定的形式。認得這些形式非常有幫助!

  • 幾何分佈 \(Geo(p)\): \(G_X(t) = \frac{pt}{1 - qt}\) (其中 \(q = 1-p\))
  • 二項分佈 \(B(n, p)\): \(G_X(t) = (q + pt)^n\)
  • 卜瓦松分佈 \(Po(\lambda)\): \(G_X(t) = e^{\lambda(t-1)}\)
  • 白努力分佈 (Bernoulli Distribution): \(G_X(t) = q + pt\)

記憶小撇步: 注意二項分佈的 PGF 看起來是否像二項式展開公式?這正是它得名的原因!當你展開括號時,機率就會被「生成」出來。

3. 使用 PGF 求平均值與變異數

這就是奇蹟發生的時刻。我們不再需要使用期望值 \(E(X)\) 和變異數 \(Var(X)\) 的標準求和公式,而是可以使用導數。

求平均值 \(E(X)\)

要找到平均值,我們只需對 PGF 微分一次,然後設 \(t = 1\)。
\(E(X) = G'_X(1)\)

求變異數 \(Var(X)\)

這一步稍微複雜一點,但比傳統方法快得多!首先求出 \(t=1\) 時的二階導數,然後使用以下公式:
\(Var(X) = G''_X(1) + G'_X(1) - [G'_X(1)]^2\)

步驟說明:
1. 對 \(G_X(t)\) 微分得到 \(G'_X(t)\)。
2. 代入 \(t=1\) 求出平均值
3. 再微分一次得到 \(G''_X(t)\)。
4. 代入 \(t=1\) 求出變異數公式所需的值。
5. 使用上述公式將它們組合起來!

常見錯誤:
學生常會忘記加上 \(G'_X(1)\) 這一項,或是忘記減去平均值的平方。務必再次檢查你的公式:「二階導數 + 平均值 - 平均值的平方」

4. 獨立隨機變數的和

如果你有兩個獨立變數 \(X\) 和 \(Y\),你想求它們和 \(Z = X + Y\) 的 PGF,該怎麼辦?

在「以前」,這需要查閱大量複雜的機率表。使用 PGF,你只需將它們相乘
規則: \(G_{X+Y}(t) = G_X(t) \times G_Y(t)\)

範例: 如果你擲兩枚獨立的骰子,每個骰子有各自的 PGF,那麼總點數的 PGF 就是兩個 PGF 相乘。

你知道嗎?
這個相乘性質就是為什麼二項分佈的 PGF 是 \((q + pt)^n\)。二項分佈不過是 \(n\) 次獨立白努力試驗的總和。因為白努力分佈的 PGF 是 \((q + pt)\),將它自己乘以 \(n\) 次就會得到 \((q + pt)^n\)!

5. 總結與關鍵要點

如果剛開始覺得符號太多,不用擔心。只要記住這三大概念:

  • PGF 是存儲器: 它將機率存儲為 \(t^x\) 的係數。
  • 微積分是你的好朋友: \(t=1\) 時的一階導數是平均值;二階導數用於計算變異數。
  • 加法變乘法: 要計算獨立變數之和的 PGF,只需將各自的 PGF 相乘。

快速回顧箱:
1. \(G_X(1) = 1\)
2. \(E(X) = G'_X(1)\)
3. \(Var(X) = G''_X(1) + G'_X(1) - [G'_X(1)]^2\)
4. 對於獨立變數 \(X, Y\): \(G_{X+Y}(t) = G_X(t)G_Y(t)\)

鼓勵的話:PGF 是統計學中最強大的「捷徑」之一。一旦掌握了基本的導數運算,你就能解決那些別人需要寫好幾頁計算過程才能解出的複雜分佈問題!繼續練習這些微分,你一定沒問題的。