二项分布的概率质量函数(PMF)公式为:
\[ P(X=k) = C(n, k) \cdot p^k \cdot (1-p)^{n-k} \]
其中:
\( n \) 是试验的总次数。
\( k \) 是事件发生的次数,取值范围为 \( 0, 1, 2, \ldots, n \)。
\( p \) 是每次试验中事件发生的概率。
\( C(n, k) \) 是组合数,表示从 \( n \) 次试验中选出 \( k \) 次成功的组合方式数,计算公式为 \( C(n, k) = \frac{n!}{k!(n-k)!} \)。
这个公式描述了在 \( n \) 次独立的伯努利试验中,事件恰好发生 \( k \) 次的概率。伯努利试验是指每次试验只有两种可能的结果,通常称为“成功”和“失败”,并且每次试验成功的概率是恒定的 \( p \)。
示例
假设有 5 次独立的试验,每次试验成功的概率为 0.3。我们需要计算恰好有 2 次成功的概率:
1. \( n = 5 \)
2. \( k = 2 \)
3. \( p = 0.3 \)
4. \( 1 - p = 0.7 \)
首先计算组合数 \( C(5, 2) \):
\[ C(5, 2) = \frac{5!}{2!(5-2)!} = \frac{5 \times 4}{2 \times 1} = 10 \]
然后代入公式计算概率:
\[ P(X=2) = 10 \cdot (0.3)^2 \cdot (0.7)^3 = 10 \cdot 0.09 \cdot 0.343 = 0.3087 \]
所以,恰好有 2 次成功的概率是 0.3087。
应用场景
二项分布广泛应用于以下场景:
医学研究(如药物试验的有效性)
质量控制(如产品合格率)
社会科学研究(如投票结果)
生物学研究(如基因突变频率)
通过二项分布,我们可以量化在固定次数的独立试验中,某一事件发生特定次数的概率。