方差是衡量数据集波动程度或离散程度的一个统计量。它的计算公式如下:
总体方差公式
$$\sigma^2 = \frac{1}{N} \sum_{i=1}^{N} (x_i - \mu)^2$$
其中:
$\sigma^2$ 表示总体方差。
$N$ 表示数据点的总数。
$x_i$ 表示第 $i$ 个数据点。
$\mu$ 表示数据的平均值,计算公式为 $\mu = \frac{1}{N} \sum_{i=1}^{N} x_i$。
样本方差公式
$$S^2 = \frac{1}{n-1} \sum_{i=1}^{n} (x_i - \bar{x})^2$$
其中:
$S^2$ 表示样本方差。
$n$ 表示样本数据点的总数。
$x_i$ 表示第 $i$ 个数据点。
$\bar{x}$ 表示样本平均值,计算公式为 $\bar{x} = \frac{1}{n} \sum_{i=1}^{n} x_i$。
解释
总体方差:是用总体数据计算得到的方差,分母是数据点的总数 $N$。
样本方差:是用样本数据计算得到的方差,分母是 $n-1$ 而不是 $N$,这是为了得到一个无偏估计。
推导过程
计算平均值
$$\mu = \frac{1}{N} \sum_{i=1}^{N} x_i$$
计算每个数据点与平均值的差
$$x_i - \mu$$
平方差值
$$(x_i - \mu)^2$$
求和
$$\sum_{i=1}^{N} (x_i - \mu)^2$$
计算方差
对于总体方差:$$\sigma^2 = \frac{1}{N} \sum_{i=1}^{N} (x_i - \mu)^2$$
对于样本方差:$$S^2 = \frac{1}{n-1} \sum_{i=1}^{n} (x_i - \bar{x})^2$$
通过以上步骤,我们可以计算出数据的方差,从而了解数据的离散程度。