Probability generating functions - Mathematics - Further (9231) - Cambridge International AS Level

在本章中，我们将学习一个非常聪明的工具，称为概率生成函数（简称 PGF）。别让这个名称吓到了！你可以把 PGF 想象成一个“数学背包”或“DNA 序列”，它将离散随机变量的所有信息都封装在一个简洁的代数式中。

如果你曾经觉得计算复杂分布的平均值和方差很繁琐，你一定会爱上 PGF。它们利用微积分的威力，能让这些计算变得快得多。让我们开始吧！

离散随机变量 \(X\) 的概率生成函数是一个幂级数，其中概率是虚变量（通常为 \(t\)）的系数。

其正式定义为：
\(G_X(t) = E(t^X) = \sum P(X = x)t^x\)

拆解来看：
如果 \(X\) 可以取值 0, 1, 2, 3...，其概率分别为 \(p_0, p_1, p_2, p_3...\)，那么：
\(G_X(t) = p_0 + p_1t^1 + p_2t^2 + p_3t^3 + ...\)

生活化类比：
想象你有一堆盒子。0 号盒子装着 \(X=0\) 的概率，1 号盒子装着 \(X=1\) 的概率，依此类推。变量 \(t^x\) 只是盒子上的标签，让我们知道哪个概率对应到 \(X\) 的哪个值。整个函数就像是一个把所有盒子整齐摆放的“架子”！

由于分布中所有概率之和必须等于 1，因此如果将 \(t = 1\) 代入任何 PGF，结果永远会是 1。
重点： \(G_X(1) = 1\)。

你不需要每次都从零开始构建 PGF。对于课程大纲中的常见分布，PGF 都有特定的形式。认得这些形式非常有帮助！

记忆小撇步： 注意二项分布的 PGF 看起来是否像二项式展开公式？这正是它得名的原因！当你展开括号时，概率就会被“生成”出来。

这就是奇迹发生的时刻。我们不再需要使用期望值 \(E(X)\) 和方差 \(Var(X)\) 的标准求和公式，而是可以使用导数。

要找到平均值，我们只需对 PGF 微分一次，然后设 \(t = 1\)。
\(E(X) = G'_X(1)\)

这一步稍微复杂一点，但比传统方法快得多！首先求出 \(t=1\) 时的二阶导数，然后使用以下公式：
\(Var(X) = G''_X(1) + G'_X(1) - [G'_X(1)]^2\)

步骤说明：
1. 对 \(G_X(t)\) 微分得到 \(G'_X(t)\)。
2. 代入 \(t=1\) 求出平均值。
3. 再微分一次得到 \(G''_X(t)\)。
4. 代入 \(t=1\) 求出方差公式所需的值。
5. 使用上述公式将它们组合起来！

常见错误：
学生常会忘记加上 \(G'_X(1)\) 这一项，或是忘记减去平均值的平方。务必再次检查你的公式：“二阶导数 + 平均值 - 平均值的平方”。

如果你有两个独立变量 \(X\) 和 \(Y\)，你想求它们和 \(Z = X + Y\) 的 PGF，该怎么做？

在“以前”，这需要查阅大量复杂的概率表。使用 PGF，你只需将它们相乘！
规则： \(G_{X+Y}(t) = G_X(t) \times G_Y(t)\)

示例： 如果你掷两枚独立的骰子，每个骰子有各自的 PGF，那么总点数的 PGF 就是两个 PGF 相乘。

你知道吗？
这个相乘性质就是为什么二项分布的 PGF 是 \((q + pt)^n\)。二项分布不过是 \(n\) 次独立伯努利试验的总和。因为伯努利分布的 PGF 是 \((q + pt)\)，将它自己乘以 \(n\) 次就会得到 \((q + pt)^n\)！

如果刚开始觉得符号太多，不用担心。只要记住这三大概念：

快速回顾箱：
1. \(G_X(1) = 1\)
2. \(E(X) = G'_X(1)\)
3. \(Var(X) = G''_X(1) + G'_X(1) - [G'_X(1)]^2\)
4. 对于独立变量 \(X, Y\)： \(G_{X+Y}(t) = G_X(t)G_Y(t)\)

鼓励的话：PGF 是统计学中强大的“捷径”之一。一旦掌握了基本的导数运算，你就能解决那些别人需要写好几页计算过程才能解出的复杂分布问题！继续练习这些微分，你一定没问题的。

* thinka提供的内容由AI生成，可能并非总是准确或最新。请将其用作辅助资源，并与官方材料进行核实。

立即实践所学