Logistic回归模型的核心是Logistic函数,也称为Sigmoid函数,其数学表达式为:
\[
\sigma(z) = \frac{1}{1 + e^{-z}}
\]
其中,\( z \) 是线性组合,表示为:
\[
z = \beta_0 + \beta_1 x_1 + \beta_2 x_2 + \ldots + \beta_m x_m
\]
对于二分类问题,因变量 \( y \) 只能取两个值,比如0和1,分别代表阴性和阳性结果。Logistic回归模型试图找到这些自变量和因变量之间的关系。模型的公式为:
\[
P(y = 1 \mid x_1, x_2, \ldots, x_m) = \sigma(\beta_0 + \beta_1 x_1 + \beta_2 x_2 + \ldots + \beta_m x_m)
\]
其中,\( \beta_0, \beta_1, \beta_2, \ldots, \beta_m \) 是模型参数,它们需要通过数据来估计。
为了将概率值转换为可以进行线性回归分析的形式,我们进行Logit变换,即:
\[
\text{logit}(p) = \ln\left(\frac{p}{1 - p}\right)
\]
将线性组合 \( z \) 代入Logit变换中,得到:
\[
\text{logit}(p) = \beta_0 + \beta_1 x_1 + \beta_2 x_2 + \ldots + \beta_m x_m
\]
因此,Logistic回归模型的公式可以表示为:
\[
\text{logit}(p) = \ln\left(\frac{p}{1 - p}\right) = \beta_0 + \beta_1 x_1 + \beta_2 x_2 + \ldots + \beta_m x_m
\]
其中,\( p \) 是因变量 \( y \) 取值为1的概率。
总结起来,Logistic回归模型的公式为:
\[
P(y = 1 \mid x_1, x_2, \ldots, x_m) = \frac{e^{\beta_0 + \beta_1 x_1 + \beta_2 x_2 + \ldots + \beta_m x_m}}{1 + e^{\beta_0 + \beta_1 x_1 + \beta_2 x_2 + \ldots + \beta_m x_m}}
\]
或者等价地:
\[
\text{logit}(p) = \beta_0 + \beta_1 x_1 + \beta_2 x_2 + \ldots + \beta_m x_m
\]
其中,\( p \) 是因变量 \( y \) 取值为1的概率,。