二项分布的期望和方差是概率论和统计学中非常重要的概念,它们分别表示在多次独立重复试验中成功次数的平均数和波动程度。
期望(Expected Value)
期望值表示在多次重复实验中,我们期望的成功次数。
对于二项分布 \(B(n, p)\),期望值 \(E(X)\) 的计算公式为:
\[
E(X) = n \cdot p
\]
其中,\(n\) 是试验的总次数,\(p\) 是每次试验成功的概率。
方差(Variance)
方差衡量的是成功次数的波动程度,即数据偏离期望值的程度。
对于二项分布 \(B(n, p)\),方差 \(Var(X)\) 的计算公式为:
\[
Var(X) = n \cdot p \cdot (1 - p)
\]
其中,\(n\) 是试验的总次数,\(p\) 是每次试验成功的概率。
示例
假设我们进行10次抛硬币的试验,每次正面朝上的概率为0.5,那么:
期望值 \(E(X)\) 为:
\[
E(X) = 10 \cdot 0.5 = 5
\]
方差 \(Var(X)\) 为:
\[
Var(X) = 10 \cdot 0.5 \cdot 0.5 = 2.5
\]
证明
二项分布的期望和方差可以通过以下几种方法证明:
分解法
将二项分布 \(X\) 分解成 \(n\) 个相互独立的、服从参数为 \(p\) 的 \(0-1\) 分布的随机变量之和 \(X = X_1 + X_2 + \cdots + X_n\),其中 \(X_i\) 的期望和方差分别为 \(p\) 和 \(p(1-p)\)。
因此,总体的期望和方差分别为:
\[
E(X) = E(X_1 + X_2 + \cdots + X_n) = n \cdot p
\]
\[
Var(X) = Var(X_1 + X_2 + \cdots + X_n) = n \cdot p \cdot (1 - p)
\]
直接计算法
通过数学期望的定义直接计算 \(E(X)\) 和 \(Var(X)\):
期望 \(E(X)\) 为:
\[
E(X) = \sum_{k=0}^{n} k \cdot P(X=k) = \sum_{k=0}^{n} k \cdot C_n^k p^k (1-p)^{n-k}
\]
通过求和公式和组合数的性质,可以简化为 \(n \cdot p\)。
方差 \(Var(X)\) 为:
\[
Var(X) = E(X^2) - [E(X)]^2
\]
其中,
\[
E(X^2) = \sum_{k=0}^{n} k^2 \cdot P(X=k) = \sum_{k=0}^{n} k^2 \cdot C_n^k p^k (1-p)^{n-k}
\]
通过求和公式和组合数的性质,可以简化为 \(n \cdot p \cdot (1-p)\)。
总结
二项分布的期望和方差分别为 \(E(X) = np\) 和 \(Var(X) = np(1-p)\),其中 \(n\) 是试验次数,\(p\) 是每次试验成功的概率。这些公式在概率论和统计学中被广泛应用,用于描述和分析独立重复试验的成功次数及其波动情况。