【0-1 损失函数】

0-1 损失函数（0-1 Loss Function）常用于分类问题，当真实值 $y$ 与预测值 $f(\mathbf{x};\boldsymbol{\theta})$ 不相等为 $1$，否则为 $0$，其标准形式如下：

$L(y,f(\mathbf{x};\boldsymbol{\theta})) = \left\{\begin{array} {rl}1 & y \neq f(\mathbf{x};\boldsymbol{\theta}) \\0 & y = f(\mathbf{x};\boldsymbol{\theta}) \end{array} \right.$

由于相等条件过于严格，因此可以放宽条件，设置一个阈值 $T$，即满足 $|y-f(\mathbf{x};\boldsymbol{\theta})|<T$ 时认为相等，否则认为不相等

$L(y,f(\mathbf{x};\boldsymbol{\theta})) = \left\{\begin{array} {rl}1, & |y - f(\mathbf{x};\boldsymbol{\theta})|\geq T \\0, & |y - f(\mathbf{x};\boldsymbol{\theta})|<T \end{array} \right.$

【平方损失函数】

平方损失函数（Quadratic Loss Function）常用于回归问题，是取真实值 $y$ 与预测值 $f(\mathbf{x};\boldsymbol{\theta})$ 差值的平方，其标准形式如下：

$L(y,f(\mathbf{x};\boldsymbol{\theta}))=(y-f(\mathbf{x};\boldsymbol{\theta}))^2$

从概率理解上，平方损失函数意味着模型的输出是以预测值为均值的高斯分布，而在最小化平方损失函数时，其本质上等同于在误差服从高斯分布的假设下的极大似然估计

【绝对值损失函数】

绝对值损失函数（Absolute Loss Function）常用于回归问题，是取真实值 $y$ 与预测值 $f(\mathbf{x};\boldsymbol{\theta})$ 差值的绝对值，其标准形式如下：

$L(y,f(\mathbf{x};\boldsymbol{\theta}))=|y-f(\mathbf{x};\boldsymbol{\theta})|$

由于此处仅是取了绝对值，并不像平方损失函数那样，差会被平方缩放

【对数损失函数】

对数损失函数（Logarithmic Loss Function）常用于多分类问题，其用到了极大似然估计的思想，能够较好的表征概率分布，标准形式如下：

$L(y,f(\mathbf{x};\boldsymbol{\theta}))=-\log_2P_{\boldsymbol{\theta}}(y|\mathbf{x})$

其中，$P_{\boldsymbol{\theta}}(y|\mathbf{x})$ 是指在当前模型上，对于样本 $\mathbf{x}$，其预测值为 $y$ 的概率

由于概率之间的同时满足需要使用乘法，为了将其转化为加法，通常将其取对数，最后由于是损失函数，所以预测正确的概率越高，其损失值应该是越小，因此要加负号取反

【交叉熵损失函数】

交叉熵损失函数（Cross-entropy Loss Function）本质上是一种对数似然函数，常用于二分类和多分类任务中，其标准形式如下：

$C=-\frac{1}{n}\sum_x[y\:ln\:a+(1-y)\:ln\:(1-a)]$

当使用 sigmoid 作为激活函数时，常用交叉熵损失函数而不用均方误差损失函数，因为它可以完美解决平方损失函数权重更新过慢的问题，具有误差大时，权重更新快；误差小时，权重更新慢的良好性质

【感知损失函数】

感知损失函数（Perceptron Loss Function）常用于感知机中，其标准形式如下：

$L(y,f(\mathbf{x};\boldsymbol{\theta}))=\max (0,-f(\mathbf{x};\boldsymbol{\theta}))$

其中，$y$ 是真实值，$f(\mathbf{x};\boldsymbol{\theta})$ 是预测值

对于感知损失函数来说，只要样本的判定类别正确就满意，不管判定边界的距离

【合页损失函数】

合页损失函数（Hinge Loss Function）常用于支持向量机中，其标准形式如下：

$L(y,f(\mathbf{x};\boldsymbol{\theta}))=\max (0,1-yf(\mathbf{x};\boldsymbol{\theta}))$

如果分类正确，损失为 $0$，否则损失 $1-yf(\mathbf{x};\boldsymbol{\theta})$，其中，$y$ 是真实值，其值为 $-1$ 或 $1$；$f(\mathbf{x};\boldsymbol{\theta})$ 是预测值，其值在 $-1$ 到 $1$ 之间

【指数损失函数】

指数损失函数（Exponential Loss Function）常用于 AdaBoost 算法中，其目标函数就是指数损失函数，标准形式如下：

$L(y, f(\mathbf{x};\boldsymbol{\theta})) = \exp[-yf(\mathbf{x};\boldsymbol{\theta})]$

其中，$\exp(*)$ 为指数函数，$y$ 是真实值，$f(\mathbf{x};\boldsymbol{\theta})$ 是预测值

Alex_McAvoy

机器学习中常见的损失函数