欢迎来到泊松分布(Poisson Distribution)的世界!
在本章中,我们要学习如何预测“不可预测”的事物。你有没有想过,客户服务中心是如何决定周二下午需要安排多少员工,或者医院是如何预估急诊室将会有多少病人到诊的吗?答案就是使用泊松分布!
我们使用这个分布来模拟在一个固定时段或空间区间内,某个事件发生的次数。如果现在觉得这些概念有点抽象,不用担心——我们会循序渐进地为你拆解!
1. 什么情况适合使用泊松分布?
在运用数学工具之前,我们必须先了解何时适合使用这个模型。若要一个情境符合泊松分布,该事件必须符合以下条件:
- 独立性 (Independently):一个事件的发生不会影响另一个事件发生的概率。(如果一个人走进商店,这并不代表会“导致”另一个人随即走进来)。
- 随机性 (Randomly):事件可以在任何时间发生。
- 单一性 (Singly):两个事件不可能在同一瞬间同时发生。
- 恒定的平均速率 (At a Constant Average Rate):事件发生的平均次数(我们称之为 \(\lambda\),即 "lambda")在整个区间内保持不变。
小比喻:想象雨滴落在一块特定的方形地砖上,过程就像是细雨绵绵。雨滴落下的过程是随机的、独立的,而且它们通常不会在同一时间精确地落在同一个点上。每分钟的平均雨滴数量保持恒定。
重点总结:
记忆口诀:记住 CRIS:Constant rate(恒定速率)、Random(随机)、Independent(独立)、Singly(单一发生)。如果这四个条件都满足,你就可以使用泊松变量了!
2. 泊松公式
泊松分布的写法为:
\(X \sim Po(\lambda)\)
这里的 \(X\) 是我们的随机变量(成功的次数),而 \(\lambda\) (lambda) 是在指定区间内发生的平均次数。
要找出精确发生 \(r\) 次成功的概率,我们使用以下公式:
\(P(X = r) = \frac{e^{-\lambda} \lambda^r}{r!}\)
符号拆解:
- \(e\):一个数学常数,约等于 2.718(你的计算器上会有一个专属按键!)。
- \(\lambda\):事件发生的平均次数。
- \(r\):你感兴趣的事件发生次数(例如:“有 3 辆车经过的概率是多少?”)。
- \(r!\):“r 的阶乘”(例如:\(3! = 3 \times 2 \times 1\))。
步骤示例:
假设学生每小时平均收到 4 封电子邮件。请找出下一个小时内该学生正好收到 2 封邮件的概率。
1. 确认 \(\lambda\):这里 \(\lambda = 4\)。
2. 确认 \(r\):我们想要 \(r = 2\)。
3. 代入公式:\(P(X=2) = \frac{e^{-4} \times 4^2}{2!}\)。
4. 计算:\(P(X=2) = \frac{0.0183 \times 16}{2} = 0.1465\)(取小数点后四位)。
快速检查:
一定要检查你的时间区间!如果平均值是每小时 4 次,但题目询问的是两小时内的概率,你必须将 \(\lambda\) 加倍变为 8。
3. 平均值与方差:同卵双胞胎
泊松分布最酷(也是最简单!)的特点之一,就是它的平均值与方差。
对于泊松分布 \(X \sim Po(\lambda)\):
平均值 \(E(X) = \lambda\)
方差 \(Var(X) = \lambda\)
你知道吗?如果题目告诉你一组数据的平均值与方差大致相等,这是一个非常强烈的暗示,表示该数据符合泊松分布!
4. 加总独立的泊松变量
有时候我们会同时遇到两个不同的泊松事件。如果 \(X\) 和 \(Y\) 是独立的泊松变量:
若 \(X \sim Po(\lambda_a)\) 且 \(Y \sim Po(\lambda_b)\),
则 \(X + Y \sim Po(\lambda_a + \lambda_b)\)。
示例:如果一家面包店平均每小时卖出 3 个白面包和 2 个黑面包,则卖出面包的总数遵循 \(Po(3 + 2) = Po(5)\)。
5. 二项分布的近似
有时候,二项分布 (Binomial distribution)(即有固定次数 \(n\) 的试验)的数值太大,使用泊松来处理会更容易。当符合以下情况时,我们可以这样做:
- \(n\) 很大(通常 \(n > 50\))。
- \(p\) 很小(概率很低,通常 \(np < 5\))。
此时,我们使用 \(\lambda = np\)。
为什么要这样做?计算 \(^{100}C_{5} \times (0.01)^5 \times (0.99)^{95}\) 比使用泊松公式困难得多。这是一个数学捷径!
常见错误避雷针:
如果 \(p\) 很大(接近 0.5),请不要使用泊松近似。这时候我们应该改用正态分布 (Normal distribution)!
6. 使用正态分布近似泊松分布
等等,我们也能把泊松转为正态分布吗?没错!如果 \(\lambda\) 很大(通常 \(\lambda > 15\)),泊松分布的图表看起来就会像对称的钟形曲线。
这种情况下,我们使用:
\(X \sim N(\lambda, \lambda)\)
(其中平均值为 \(\lambda\),方差也是 \(\lambda\))。
重要:连续性修正 (Continuity Correction)!
因为泊松是离散的(你不可能收到 4.5 封邮件),而正态分布是连续的(你可以有 4.5 厘米),所以两者转换时,必须调整数值 0.5。
示例:若要使用正态近似法求 \(P(X > 20)\),你实际上要计算的是 \(P(X > 20.5)\)。
重点总结:
检查你的 \(\lambda\):
- 如果 \(\lambda\) 很小:使用标准泊松公式。
- 如果 \(\lambda\) 很大 (\(> 15\)):使用正态近似法,并记得加上连续性修正。
总结检查清单
在参加考试前,确保你能做到以下事项:
- 列出泊松分布的 4 个条件 (CRIS)。
- 使用 \(e^{-\lambda}\) 公式计算概率。
- 针对不同时间区间调整 \(\lambda\)。
- 辨识何时该用泊松来近似二项分布。
- 当 \(\lambda\) 很大时,使用正态分布来近似泊松(记得 0.5 的修正!)。
你一定没问题的!泊松分布里的希腊字母看起来可能有点吓人,但它不过是一种计算随机事件的方法。继续练习历届试题吧!