欢迎来到泊松分布(Poisson Distribution)的世界!

在本章中,我们要学习如何预测“不可预测”的事物。你有没有想过,客户服务中心是如何决定周二下午需要安排多少员工,或者医院是如何预估急诊室将会有多少病人到诊的吗?答案就是使用泊松分布

我们使用这个分布来模拟在一个固定时段或空间区间内,某个事件发生的次数。如果现在觉得这些概念有点抽象,不用担心——我们会循序渐进地为你拆解!

1. 什么情况适合使用泊松分布?

在运用数学工具之前,我们必须先了解何时适合使用这个模型。若要一个情境符合泊松分布,该事件必须符合以下条件:

  • 独立性 (Independently):一个事件的发生不会影响另一个事件发生的概率。(如果一个人走进商店,这并不代表会“导致”另一个人随即走进来)。
  • 随机性 (Randomly):事件可以在任何时间发生。
  • 单一性 (Singly):两个事件不可能在同一瞬间同时发生。
  • 恒定的平均速率 (At a Constant Average Rate):事件发生的平均次数(我们称之为 \(\lambda\),即 "lambda")在整个区间内保持不变。

小比喻:想象雨滴落在一块特定的方形地砖上,过程就像是细雨绵绵。雨滴落下的过程是随机的、独立的,而且它们通常不会在同一时间精确地落在同一个点上。每分钟的平均雨滴数量保持恒定

重点总结:

记忆口诀:记住 CRISConstant rate(恒定速率)、Random(随机)、Independent(独立)、Singly(单一发生)。如果这四个条件都满足,你就可以使用泊松变量了!

2. 泊松公式

泊松分布的写法为:
\(X \sim Po(\lambda)\)

这里的 \(X\) 是我们的随机变量(成功的次数),而 \(\lambda\) (lambda) 是在指定区间内发生的平均次数。

要找出精确发生 \(r\) 次成功的概率,我们使用以下公式:
\(P(X = r) = \frac{e^{-\lambda} \lambda^r}{r!}\)

符号拆解:

  • \(e\):一个数学常数,约等于 2.718(你的计算器上会有一个专属按键!)。
  • \(\lambda\):事件发生的平均次数。
  • \(r\):你感兴趣的事件发生次数(例如:“有 3 辆车经过的概率是多少?”)。
  • \(r!\):“r 的阶乘”(例如:\(3! = 3 \times 2 \times 1\))。

步骤示例:
假设学生每小时平均收到 4 封电子邮件。请找出下一个小时内该学生正好收到 2 封邮件的概率。
1. 确认 \(\lambda\):这里 \(\lambda = 4\)。
2. 确认 \(r\):我们想要 \(r = 2\)。
3. 代入公式:\(P(X=2) = \frac{e^{-4} \times 4^2}{2!}\)。
4. 计算:\(P(X=2) = \frac{0.0183 \times 16}{2} = 0.1465\)(取小数点后四位)。

快速检查:

一定要检查你的时间区间!如果平均值是每小时 4 次,但题目询问的是两小时内的概率,你必须将 \(\lambda\) 加倍变为 8。

3. 平均值与方差:同卵双胞胎

泊松分布最酷(也是最简单!)的特点之一,就是它的平均值与方差。

对于泊松分布 \(X \sim Po(\lambda)\):
平均值 \(E(X) = \lambda\)
方差 \(Var(X) = \lambda\)

你知道吗?如果题目告诉你一组数据的平均值与方差大致相等,这是一个非常强烈的暗示,表示该数据符合泊松分布!

4. 加总独立的泊松变量

有时候我们会同时遇到两个不同的泊松事件。如果 \(X\) 和 \(Y\) 是独立的泊松变量:

若 \(X \sim Po(\lambda_a)\) 且 \(Y \sim Po(\lambda_b)\),
\(X + Y \sim Po(\lambda_a + \lambda_b)\)

示例:如果一家面包店平均每小时卖出 3 个白面包和 2 个黑面包,则卖出面包的总数遵循 \(Po(3 + 2) = Po(5)\)。

5. 二项分布的近似

有时候,二项分布 (Binomial distribution)(即有固定次数 \(n\) 的试验)的数值太大,使用泊松来处理会更容易。当符合以下情况时,我们可以这样做:

  1. \(n\) 很大(通常 \(n > 50\))。
  2. \(p\) 很小(概率很低,通常 \(np < 5\))。

此时,我们使用 \(\lambda = np\)

为什么要这样做?计算 \(^{100}C_{5} \times (0.01)^5 \times (0.99)^{95}\) 比使用泊松公式困难得多。这是一个数学捷径!

常见错误避雷针:

如果 \(p\) 很大(接近 0.5),请不要使用泊松近似。这时候我们应该改用正态分布 (Normal distribution)!

6. 使用正态分布近似泊松分布

等等,我们也能把泊松转为正态分布吗?没错!如果 \(\lambda\) 很大(通常 \(\lambda > 15\)),泊松分布的图表看起来就会像对称的钟形曲线。

这种情况下,我们使用:
\(X \sim N(\lambda, \lambda)\)
(其中平均值为 \(\lambda\),方差也是 \(\lambda\))。

重要:连续性修正 (Continuity Correction)!
因为泊松是离散的(你不可能收到 4.5 封邮件),而正态分布是连续的(你可以有 4.5 厘米),所以两者转换时,必须调整数值 0.5
示例:若要使用正态近似法求 \(P(X > 20)\),你实际上要计算的是 \(P(X > 20.5)\)。

重点总结:

检查你的 \(\lambda\):
- 如果 \(\lambda\) 很小:使用标准泊松公式。
- 如果 \(\lambda\) 很大 (\(> 15\)):使用正态近似法,并记得加上连续性修正。

总结检查清单

在参加考试前,确保你能做到以下事项:

  • 列出泊松分布的 4 个条件 (CRIS)。
  • 使用 \(e^{-\lambda}\) 公式计算概率。
  • 针对不同时间区间调整 \(\lambda\)。
  • 辨识何时该用泊松来近似二项分布。
  • 当 \(\lambda\) 很大时,使用正态分布来近似泊松(记得 0.5 的修正!)。

你一定没问题的!泊松分布里的希腊字母看起来可能有点吓人,但它不过是一种计算随机事件的方法。继续练习历届试题吧!