方差是衡量一组数据离散程度的统计量,表示数据与其均值的偏离程度。方差的计算公式如下:
基本公式
$$
S^2 = \frac{1}{n} \sum_{i=1}^{n} (x_i - \mu)^2
$$
其中:
$S^2$ 表示方差
$n$ 是数据的个数
$x_i$ 是第 $i$ 个数据
$\mu$ 是数据的均值,计算公式为 $\mu = \frac{1}{n} \sum_{i=1}^{n} x_i$
另一种表达形式
$$
S^2 = \frac{1}{n} \left[ (x_1 - m)^2 + (x_2 - m)^2 + \cdots + (x_n - m)^2 \right]
$$
其中:
$m$ 是数据的平均数
方差的性质
设 $C$ 为常数,则 $D(C) = 0$
$D(CX) = C^2D(X)$
标准方差
标准方差是方差的平方根,记为 $\sigma$,即 $\sigma = \sqrt{S^2}$。标准方差与原始数据具有相同的量纲,这使得它更易于解释和比较
示例
假设有一组数据:$x_1 = 1, x_2 = 2, x_3 = 3, x_4 = 4, x_5 = 5$
计算均值
$$
\mu = \frac{1 + 2 + 3 + 4 + 5}{5} = 3
$$
计算每个数据与均值的差的平方
$$
(1 - 3)^2 = 4, \quad (2 - 3)^2 = 1, \quad (3 - 3)^2 = 0, \quad (4 - 3)^2 = 1, \quad (5 - 3)^2 = 4
$$
求和并取平均
$$
S^2 = \frac{1}{5} (4 + 1 + 0 + 1 + 4) = \frac{10}{5} = 2
$$
因此,这组数据的方差 $S^2$ 为 2。
建议
在实际应用中,方差和标准差常用于金融、质量控制、机器学习等领域,以评估数据的稳定性和预测误差。理解方差的概念和计算公式有助于更好地分析和解释数据。