L2 Penalty Method
问题形式
-
等式约束
- 原问题:,
- 罚函数形式:
- 上面使用的是二阶罚函数法,求解精度取决于的大小,但无法求得精确解
-
不等式约束
- 原问题:,
- 罚函数形式:
- 上面使用的也是二阶罚函数法,但罚函数的二阶导不连续,无法求得精确解
迭代过程
- 直接法
- 直接取一个很大的,优化一次得到最优解
- sequential方法
- 取,优化得到最优解
- 取,以为初值,优化得到最优解
- 重复该过程,直到足够大
- 具体用哪种方法取决于对耗时和精度的要求
使用场景
- 约束最好具有具体的物理意义,因为该方法是得不到精确解的,且最终解实际上会一定程度上违反约束
- 对精度要求不是很高,在量级左右
L1 Penalty Method
问题形式
- 原问题:,,
- 罚函数形式:
- 上面使用的是一阶罚函数法,罚函数的一阶导不连续,当充分大时(不用像L2方法一样取那么大),可以得到精确解
- 虽然可以得到精确解,但由于其non smooth的性质,lbfgs在求解该类型问题时收敛速度是不能保证的