Reference
【判别分类模型】
假设分类模型为一判别模型,选用条件概率分布
该模型的含义为:对于给定的输入
【特征函数】
特征函数(Feature Function)用于描述输入
其是一个二值函数,用于将数据集数学化
举例来说,对于如下数据集:
取第一列为
如此,可以为每个 <特征,标签>
对都做一个如上的特征函数,以实现数据集数学化
【经验分布】
对于给定训练集,可将训练数据当做由随机变量
记
【约束条件】
对于来自参数空间
对于随机变量
按照期望的定义,对于任意的特征函数
对于任意的特征函数
对于判别模型
即:
上式即为最大熵模型中要满足的约束条件
需要注意的是,由于特征函数是对数据集实现数学化的,每个 <特征,标签>
对都会做一个特征函数,因此,若有
满足所有约束条件的模型集合为:
【最大熵模型】
对于给定的训练集
对于从训练集获得的特征函数和约束条件,将信息熵的概念应用到条件分布中,条件概率分布
此时,在约束条件的模型集合
要注意的是,式中的对数取自然对数
Be the first person to leave a comment!