Reference
【DFP 与 BFGS 的关系】
对于 DFP 算法来说,其迭代式为:
利用在 BFGS 算法 中提到的 Sherman-Morrison-Woodbury 公式,对其两边进行求逆(证明过程与 BFGS 中相似),可得:
对于 BFGS 算法来说,其迭代格式为:
在 BFGS 算法 中,详细证明了使用 Sherman-Morrison-Woodbury 公式后得到的蕴含
在 拟牛顿迭代法 中,介绍了拟牛顿条件,其对牛顿法迭代过程中的海森矩阵
因此,有:
此时再看 DFP 和 BFGS 迭代式与其求逆后的迭代式,可以发现,双方高度对称,只需令
因此,DFP 与 BFGS 互为对偶
【Broyden 族】
既然 DFP 与 BFGS 互为对偶,那么在具体应用中,选择哪一个会更好?
一个基本的思路是通过若干组实验来测试哪个算法在模型训练过程中更优,或对其进行收敛验证,但这无疑会耗费大量的时间
为此,Broyden 提出了一种较为简易的思路,即将 DFP 的迭代式与 BFGS 的迭代式进行正加权组合
将由 DFP 算法的迭代式得到的
再将使用 Sherman-Morrison 公式后的 BFGS 算法的迭代式得到的
由于
当
随着
Gitalking ...