Penalty Methods

L2 Penalty Method

问题形式

  • 等式约束

    • 原问题:
    • 罚函数形式:
    • 上面使用的是二阶罚函数法,求解精度取决于的大小,但无法求得精确解
  • 不等式约束

    • 原问题:
    • 罚函数形式:
    • 上面使用的也是二阶罚函数法,但罚函数的二阶导不连续,无法求得精确解

迭代过程

  • 直接法
    • 直接取一个很大的,优化一次得到最优解
  • sequential方法
    • ,优化得到最优解
    • ,以为初值,优化得到最优解
    • 重复该过程,直到足够大
  • 具体用哪种方法取决于对耗时和精度的要求

使用场景

  • 约束最好具有具体的物理意义,因为该方法是得不到精确解的,且最终解实际上会一定程度上违反约束
  • 对精度要求不是很高,在量级左右

L1 Penalty Method

问题形式

  • 原问题:
  • 罚函数形式:
  • 上面使用的是一阶罚函数法,罚函数的一阶导不连续,当充分大时(不用像L2方法一样取那么大),可以得到精确解
  • 虽然可以得到精确解,但由于其non smooth的性质,lbfgs在求解该类型问题时收敛速度是不能保证的

Search

    欢迎添加我的微信

    闷骚的程序员

    Table of Contents