补充,鞍点与强对偶

1. 原问题和对偶问题

  • 用原问题(Primal Problem)中的P表示原问题,具体如下:
    ( P )      min ⁡    f ( x ) s t .      g i ( x ) ≤ 0 , i = 1 , ⋯   , m ,              h i ( x ) = 0 , i = 1 , ⋯   , l ,              x ∈ X \begin{equation}\begin{aligned} &(P)\; \;\min\; f(x)\\ &st.\;\;g_i(x)\le0,i=1,\cdots,m,\\ &\;\;\;\;\;\;h_i(x)=0,i=1,\cdots,l,\\ &\;\;\;\;\;\;x\in X\\ \end{aligned}\end{equation} (P)minf(x)st.gi(x)0,i=1,,m,hi(x)=0,i=1,,l,xX
  • 用对偶问题(duality Problem)中的D表示对偶问题,具体如下:
    ( D )      max ⁡ λ ≥ 0 , μ min ⁡ x ∈ X L ( x , λ , μ ) L ( x , λ , μ ) = f ( x ) + ∑ i = 1 m λ i g i ( x ) + ∑ i = 1 l μ i h i ( x ) , x ∈ X \begin{equation}\begin{aligned} &(D)\; \;\max\limits_{\lambda\ge0,\mu}\min\limits_{x\in X}\mathrm{L}(x,\lambda,\mu)\\ &\mathrm{L}(x,\lambda,\mu)=f(x)+\sum_{i=1}^m\lambda_ig_i(x)+\sum_{i=1}^l\mu_ih_i(x),x\in X\\ \end{aligned}\end{equation} (D)λ0,μmaxxXminL(x,λ,μ)L(x,λ,μ)=f(x)+i=1mλigi(x)+i=1lμihi(x),xX
  • 原问题的拉格朗日函数形式:
    ( P )      min ⁡ x ∈ X max ⁡ λ ≥ 0 , μ L ( x , λ , μ ) L ( x , λ , μ ) = f ( x ) + ∑ i = 1 m λ i g i ( x ) + ∑ i = 1 l μ i h i ( x ) , x ∈ X \begin{equation}\begin{aligned} &(P)\; \;\min\limits_{x\in X}\max\limits_{\lambda\ge0,\mu}\mathrm{L}(x,\lambda,\mu)\\ &\mathrm{L}(x,\lambda,\mu)=f(x)+\sum_{i=1}^m\lambda_ig_i(x)+\sum_{i=1}^l\mu_ih_i(x),x\in X\\ \end{aligned}\end{equation} (P)xXminλ0,μmaxL(x,λ,μ)L(x,λ,μ)=f(x)+i=1mλigi(x)+i=1lμihi(x),xX

2. Slater 条件

  • 假设:
    1) 集合X为非空凸集, f ( x ) f(x) f(x) g i ( x ) , i = 1 , 2 , ⋯   , m g_i(x),i=1,2,\cdots,m gi(x),i=1,2,,m是凸函数, h i ( x ) , i = 1 , 2 , ⋯   , l h_i(x),i=1,2,\cdots,l hi(x),i=1,2,,l均为线性函数。
    2) 假设存在 x ^ ∈ X \hat{x}\in X x^X使得 g i ( x ^ ) < 0 , i = 1 , ⋯   , m , h i ( x ^ ) = 0 , i = 1 , ⋯   , l g_i(\hat{x})<0,i=1,\cdots,m,h_i(\hat{x})=0,i=1,\cdots,l gi(x^)<0,i=1,,m,hi(x^)=0,i=1,,l,且
    0 ∈ i n t    h ( X ) 0\in \mathrm{int}\; h(X) 0inth(X),其中 h ( X ) = { [ h 1 ( x ) , h 2 ( x ) , ⋯   , h l ( x ) ] T ∣ x ∈ X } h(X)=\{[h_1(x),h_2(x),\cdots,h_l(x)]^T\big|x\in X\} h(X)={[h1(x),h2(x),,hl(x)]T xX},则强对偶成立,即:
    min ⁡ { f ( x ) ∣ x ∈ S } = max ⁡ { d ( λ , μ ) ∣ λ ≥ 0 , μ } \begin{equation} \min \{f(x)|x\in S\}=\max \{d(\lambda,\mu)\big|\lambda \ge 0,\mu\} \end{equation} min{f(x)xS}=max{d(λ,μ) λ0,μ}

3. xxx

  • 假设原问题P有最优解 x ˉ \bar{x} xˉ,其对偶问题D有最优解 ( λ ˉ , μ ˉ ) (\bar{\lambda},\bar{\mu}) (λˉ,μˉ),满足强对偶关系, v ( P ) = v ( D ) v(P)=v(D) v(P)=v(D),且可得:
    g i ( x ˉ ) ≤ 0 , h i ( x ˉ ) = 0 , x ˉ ≤ X , λ ˉ ≥ 0 , f ( x ˉ ) = d ( λ ˉ , μ ˉ ) \begin{equation} g_i(\bar{x})\le 0,h_i(\bar{x})=0,\bar{x}\le X,\bar{\lambda}\ge 0,f(\bar{x})=d(\bar{\lambda},\bar{\mu}) \end{equation} gi(xˉ)0,hi(xˉ)=0,xˉX,λˉ0,f(xˉ)=d(λˉ,μˉ)
  • 因为 f ( x ˉ ) f(\bar{x}) f(xˉ)为原问题最小值,所以其他值必然大于此值:
    v ( P ) = f ( x ˉ ) ≤ f ( x ) \begin{equation} v(P)=f(\bar{x})\le f(x) \end{equation} v(P)=f(xˉ)f(x)
  • 因为 d ( λ ˉ , μ ˉ ) d(\bar{\lambda},\bar{\mu}) d(λˉ,μˉ)为对偶函数的最大值,则其他值必然小于此值:
    d ( λ , μ ) ≤ d ( λ ˉ , μ ˉ ) \begin{equation} d(\lambda,\mu)\le d(\bar{\lambda},\bar{\mu}) \end{equation} d(λ,μ)d(λˉ,μˉ)
  • 因为 g i ( x ) ≤ 0 , λ i > 0 , h i ( x ) = 0 g_i(x)\le 0,\lambda_i>0,h_i(x)=0 gi(x)0,λi>0,hi(x)=0可得:
    d ( λ ˉ , μ ˉ ) ≤ f ( x ˉ ) \begin{equation} d(\bar{\lambda},\bar{\mu})\le f(\bar{x}) \end{equation} d(λˉ,μˉ)f(xˉ)
  • 综上所述,弱对偶定理可得:
    d ( λ , μ ) ≤ d ( λ ˉ , μ ˉ ) = v ( D ) ≤ v ( P ) = f ( x ˉ ) ≤ f ( x ) \begin{equation} d(\lambda,\mu)\le d(\bar{\lambda},\bar{\mu})=v(D)\le v(P)=f(\bar{x})\le f(x) \end{equation} d(λ,μ)d(λˉ,μˉ)=v(D)v(P)=f(xˉ)f(x)
  • 转换为拉格朗日函数可得:
    L ( x ˉ , λ , μ ) ≤ L ( x ˉ , λ ˉ , μ ˉ ) ≤ L ( x , λ ˉ , μ ˉ ) \begin{equation} L(\bar{x},\lambda,\mu)\le L(\bar{x},\bar{\lambda},\bar{\mu})\le L(x,\bar{\lambda},\bar{\mu}) \end{equation} L(xˉ,λ,μ)L(xˉ,λˉ,μˉ)L(x,λˉ,μˉ)
  • 我们发现此时的点 ( x ˉ , λ ˉ , μ ˉ ) (\bar{x},\bar{\lambda},\bar{\mu}) (xˉ,λˉ,μˉ)在左边函数是最大值,在右边函数里面时最小值,是不是就是我们图像里面的鞍点。
    在这里插入图片描述

相关推荐

  1. (PTA)

    2024-07-20 17:22:02       49 阅读
  2. 计算(C++)

    2024-07-20 17:22:02       61 阅读
  3. B2102 计算

    2024-07-20 17:22:02       47 阅读
  4. 求某个矩阵的的个数

    2024-07-20 17:22:02       26 阅读
  5. 3708. 求矩阵的 四川大学考研机试题

    2024-07-20 17:22:02       49 阅读
  6. C语言 找出一个二维数组中的

    2024-07-20 17:22:02       25 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-07-20 17:22:02       123 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-07-20 17:22:02       131 阅读
  3. 在Django里面运行非项目文件

    2024-07-20 17:22:02       109 阅读
  4. Python语言-面向对象

    2024-07-20 17:22:02       117 阅读

热门阅读

  1. Window任务栏应用图片无法加载解决方法

    2024-07-20 17:22:02       31 阅读
  2. linux shell(上)

    2024-07-20 17:22:02       31 阅读
  3. RK3588 编译opencv&opencv_contrib记录

    2024-07-20 17:22:02       34 阅读
  4. 二叉树---路径总和

    2024-07-20 17:22:02       25 阅读
  5. windows 安装 kubectl 并连接到 k8s 集群【图文教程】

    2024-07-20 17:22:02       26 阅读
  6. computeIfAbsent 和 putIfAbsent

    2024-07-20 17:22:02       27 阅读
  7. 微软Edge浏览器全解析教程

    2024-07-20 17:22:02       25 阅读
  8. 如何使用unittest框架来编写和运行单元测试

    2024-07-20 17:22:02       25 阅读
  9. 数学建模熵权法

    2024-07-20 17:22:02       30 阅读
  10. RabbitMQ线程和连接模型详解

    2024-07-20 17:22:02       29 阅读
  11. 探索现代Web开发:WebKit的剪贴板API革新

    2024-07-20 17:22:02       39 阅读