Alex_McAvoy

想要成为渔夫的猎手

对数线性回归与广义线性模型

【对数线性回归】

对于给定的容量为 $n$ 的训练集 $D=\{(\mathbf{x_1},y_1),(\mathbf{x_2},y_2),…,(\mathbf{x_n},y_n)\}$,第 $i$ 组样本中的输入 $\mathbf{x_i}$ 具有 $m$ 个特征值,即:$\mathbf{x_i}=(x_i^{(1)},x_i^{(2)},…,x_i^{(m)})\in \mathbb{R}^m$,输出为 $y_i$,多元线性回归学习到的模型为 $f(\mathbf{x_i};\boldsymbol{\theta})$,使得 $f(x_i;\boldsymbol{\theta})\simeq y_i$

假设函数 $f(\mathbf{x_i};\boldsymbol{\theta})$ 形式如下:

其中,特征参数 $\boldsymbol{\theta}$ 为 $(m+1)\times 1$ 的列向量,即:

为了表述方便,对假设函数进行简化,定义一个额外的第 $0$ 个特征量,这个特征量对所有样本的取值全部为 $1$,这使得特征量从过去的 $m$ 个变为 $m+1$ 个,即设:$x_i^{(0)}=1$

那么假设函数就可以写为:

将数据集 $D$ 写为 $(m+1)\times n$ 的矩阵,即:

同时,将预测值 $\hat{y_i}$ 也写为矩阵形式,即预测输出变量 $\hat{Y}$ 为 $n\times 1$ 的列向量:

那么,多元线性回归模型就可写为:

当给定输入值后,如果希望预测值能够逼近真实值 $y_i$ 的衍生物,即输出是在指数尺度上变化时,就可将输出的对数作为线性模型逼近的目标,即:

这就是对数线性回归(Log-linear Regression),实际上是试图让 $e^{\boldsymbol{\theta}^TX}$ 逼近真实输出 $\hat{Y}$

对数线性回归形式上虽然仍是线性回归,但其实质上是在求取输入空间到输出空间的非线性函数的映射

【广义线性模型】

更一般地,考虑单调可微函数 $g(\cdot)$,令:

这样的模型称为广义线性模型(Generalized Linear Model,GLM),其中 $g(\cdot)$ 称为联系函数(Link Function)

显然,线性回归、对数线性回归、Logistic 回归是 GLM 的联系函数 $g(\cdot)$ 不同时的特例,可以总结为下表:

联系函数 输出变量类型 使用场景
线性回归 $g(z)=z$ 连续变量 身高、体重、房价等
对数线性回归 $g(z)=ln(z)$ 计数变量 销售数量、车祸数量等
二元 Logistic 回归 $g(z)=ln\frac{P(z=1)}{1-P(z=1)}$ 二分类变量 购买行为、投票行为等
多元 Logistic 回归 $g(z)=ln\frac{P(z=i)}{1-P(z=N)}$ 多分类变量 评分等级、多分类模型等
感谢您对我的支持,让我继续努力分享有用的技术与知识点!