Alex_McAvoy

想要成为渔夫的猎手

条件随机场的条件概率计算

【概述】

对于线性链条件随机场的概率计算问题,即:给定线性链条件随机场 P(Y|X),输入序列 x 和输出序列 y,计算条件概率 P(Yi=yi|x)P(Yi1=yi1,Yi=yi|x),以及相应的数学期望

与隐马尔可夫模型类似,引入前向向量与后向向量,递推的计算条件概率以及期望值,这样的算法称为前向-后向算法(Forward-backward Algorithm)

【前向向量与后向向量】

前向向量

对于线性链条件随机场的矩阵形式:

Pw(y|x)=1Zw(x)i=1n+1Mi(yi1,yi|x)Zw(x)=[M1(x)M2(x)Mn+1(x)]start,stop

对每个指标 i=0,1,,n+1,定义前向向量 αi(x)

α0(y|x)={1,y=start0,ystart

有递推公式:

αiT(yi|x)=αi1T(yi1|x)[Mi(yi,yi|x)],i=1,2,,n+1

其中,αi(yi|x) 表示在位置 i 的标记是 yi 且从 1i 的前部分标记序列的非规范化概率,yi 可取的值有 m 个,故可将其写为 m 维列向量形式,即:

αiT(x)=αi1T(x)Mi(x)

后向向量

同理,对每个指标 i=0,1,,n+1,定义后向向量 βi(x)

βn+1(yn+1|x)={1,yn+1=stop0,yn+1stop

有递推公式:

βi(yi|x)=[Mi+1(yi,yi+1|x)]βi+1(yi+1|x),i=1,2,,n+1

其中,βi(yi|x) 表示在位置 i 的标记是 yi 且从 i+1n 的后部分标记序列的非规范化概率,yi 可取的值有 m 个,故可将其写为 m 维行向量形式,即:

βi(x)=Mi+1(x)βi+1(x)

【概率计算】

根据前向向量与后向向量的定义,可计算出标记序列在位置 i 是标记 yi 的条件概率:

P(Yi=yi|x)=αiT(yi|x)βi(yi|x)Z(x)

以及在位置 i1i 是标记 yi1yi 的条件概率,即:

P(Yi1=yi1,Yi=yi|x)=αi1T(yi1|x)Mi(yi1,yi|x)βi(yi|x)Z(x)

其中,对于规范化因子 Z(x),有:

Z(x)=αnT(x)1=1β1(x)

1 是元素均为 1m 维列向量

【期望值计算】

条件分布

根据前向向量与后向向量的定义,对于特征函数 fk(y,x),其关于条件分布 P(Y|X) 的数学期望为:

EP(Y|X)[fk]=yP(y|x)fk(y,x)=i=1n+1yi1yifk(yi1,yi,x,i)αi1T(yi1|x)Mi(yi1,yi|x)βi(yi|x)Z(x)k=1,2,,K

其中,对于规范化因子 Z(x)​,有:

Z(x)=αnT(x)1=1β1(x)

上式为特征函数关于 P(X|Y) 的数学期望的一般计算公式,对于转移特征

tk(yi1,yi,x,i),k=1,2,,K1

可将上式中的 fk 替换为 tk,对于状态特征

sl(yi,x,i)k=K1+l,l=1,2,,K2

可将上式中的 fk 替换为 sl

联合分布

假设经验分布为 P~(X),特征函数 fk(y,x) 关于联合分布 P(X,Y) 的数学期望为:

EP(X,Y)[fk]=x,yP(x,y)i=1n+1fk(yi1,yi,x,i)=xP~(x)yP(y|x)i=1n+1fk(yi1,yi,x,i)=xP~(x)i=1n+1yi1yifk(yi1,yi,x,i)αi1T(yi1|x)Mi(yi1,yi|x)βi(yi|x)Z(x)k=1,2,,K

其中,对于规范化因子 Z(x)​,有:

Z(x)=αnT(x)1=1β1(x)

上式为特征函数关于 P(X,Y) 的数学期望的一般计算公式,对于转移特征

tk(yi1,yi,x,i),k=1,2,,K1

可将上式中的 fk 替换为 tk,对于状态特征

sl(yi,x,i)k=K1+l,l=1,2,,K2

可将上式中的 fk 替换为 sl

感谢您对我的支持,让我继续努力分享有用的技术与知识点!
0 comments
Anonymous
Markdown is supported

Be the first person to leave a comment!