皮尔森相关系数

时间:2025-03-08 16:19:09 手机游戏

皮尔森相关系数(Pearson correlation coefficient),也称皮尔森积矩相关系数(Pearson product-moment correlation coefficient),是一种 线性相关系数,用于反映两个变量线性相关程度的统计量。相关系数用r表示,其中n为样本量,分别为两个变量的观测值和均值。r描述的是两个变量间线性相关强弱的程度,其取值在-1与+1之间。

定义

皮尔森相关系数定义为两个变量之间的协方差和标准差的商。

公式为:r = cov(X, Y) / (σ_X * σ_Y),其中cov(X, Y)是X和Y的协方差,σ_X和σ_Y分别是X和Y的标准差。

取值范围

r的取值在-1与+1之间。

若r > 0,表明两个变量是正相关,即一个变量的值越大,另一个变量的值也会越大。

若r < 0,表明两个变量是负相关,即一个变量的值越大,另一个变量的值反而会越小。

若r = 0,表明两个变量间不是线性相关,但有可能是其他方式的相关(比如曲线方式)。

显著性检验

皮尔森相关系数本身并不能检验两个变量之间的因果关系,但可以用于检验两个变量之间的线性关系是否显著。

通常需要计算p值,p值小于0.05表示两个变量之间存在显著的线性关系,p值高于0.05则表示两个变量之间不存在显著的线性关系。

应用

皮尔森相关系数广泛应用于各种领域,包括经济学、社会学、生物学、医学等,用于量化两个变量之间的线性关系强度。

示例

假设有两个变量X和Y,在8个样本中的表达量值如下:

X = [1.1, 1.2, 1.0, 0.9, 1.2, 1.1, 0.9, 1.0]

Y = [14, 13, 15, 15, 13, 14, 15, 16]

计算皮尔森相关系数的步骤如下:

1. 计算X和Y的均值:

μ_X = (1.1 + 1.2 + 1.0 + 0.9 + 1.2 + 1.1 + 0.9 + 1.0) / 8 = 1.0

μ_Y = (14 + 13 + 15 + 15 + 13 + 14 + 15 + 16) / 8 = 14.25

2. 计算X和Y的协方差:

cov(X, Y) = Σ(X_i - μ_X) * (Y_i - μ_Y) / (n - 1)

cov(X, Y) = ((1.1-1.0)*(14-14.25) + (1.2-1.0)*(13-14.25) + ... + (1.0-1.0)*(16-14.25)) / 7

cov(X, Y) = (-0.1*-1.25 + 0.2*-1.25 + ... + 0.0*1.75) / 7

cov(X, Y) = 0.75

3. 计算X和Y的标准差:

σ_X = sqrt(Σ(X_i - μ_X)^2 / (n - 1))

σ_X = sqrt(((1.1-1.0)^2 + (1.2-1.0)^2 + ... + (1.0-1.0)^2) / 7)

σ_X = sqrt(0.01 + 0.04 + ... + 0.01)

σ_X = sqrt(0.08) ≈ 0.283

σ_Y = sqrt(Σ(Y_i - μ_Y)^2 / (n - 1))

σ_Y = sqrt(((14-14.25