方差和标准差的公式如下:
方差公式
总体方差(σ²):
\[
S^2 = \frac{1}{N} \sum_{i=1}^{N} (x_i - \mu)^2
\]
其中,\( N \) 是数据点的数量,\( x_i \) 是每个数据点,\( \mu \) 是数据的平均值。
样本方差(s²):
\[
s^2 = \frac{1}{n-1} \sum_{i=1}^{n} (x_i - \bar{x})^2
\]
其中,\( n \) 是样本中数据点的数量,\( x_i \) 是每个数据点,\( \bar{x} \) 是样本的平均值。
标准差公式
总体标准差(σ):
\[
\sigma = \sqrt{S^2} = \sqrt{\frac{1}{N} \sum_{i=1}^{N} (x_i - \mu)^2}
\]
样本标准差(s):
\[
s = \sqrt{s^2} = \sqrt{\frac{1}{n-1} \sum_{i=1}^{n} (x_i - \bar{x})^2}
\]
解释
方差:方差衡量的是数据点与其平均值之间的平均距离的平方。总体方差反映的是整个数据集的分散程度,而样本方差则是从样本数据中估计出的总体方差。
标准差:标准差是方差的平方根,它提供了数据点与平均值之间距离的度量,并且是一个更易于理解和解释的指标。标准差越大,数据的分散程度越高。
注意事项
在实际应用中,样本方差通常使用 \( n-1 \) 而不是 \( n \) 作为分母,这是为了校正样本估计的偏差,这种方法称为Bessel's correction。
标准差和方差的单位与原始数据的单位相同,这使得它们在比较不同数据集时非常有用。