凸集分离定理_对偶定理_鞍点定理
目录
- 凸优化
- 定理
- 凸集分离定理
- 定理1
- 定理2
- 定理3
- 分离定理
- Farkas定理
- Gordan定理
- 对偶定理
- 原问题
- 对偶问题
- 弱对偶定理
- 推论1
- 推论2
- 推论3
- 推论4
- 引理
- 强对偶定理
- 鞍点定理
- 原问题
- 对偶问题
- 鞍点定义
- 鞍点定理
本文篇文章内容来自清华大学研究生教材"最优化理论与算法"的定理整理。
后面的定理能够由前面的定理推导得到.
凸优化
min f ( x ) s . t . g i ( x ) ≥ 0 i = 1 , ⋯ m h j ( x ) = 0 j = 1 , ⋯ l \begin{aligned} &\min &&f(\boldsymbol x)\\ &s.t. &&\boldsymbol{g_i(x)\geq 0} &&i=1,\cdots m\\ &&&\boldsymbol{h_j(x)=0} &&j=1,\cdots l\\ \end{aligned} mins.t.f(x)gi(x)≥0hj(x)=0i=1,⋯mj=1,⋯l
\quad 其中 f ( x ) f(\boldsymbol{x}) f(x)是凸函数, g i ( x ) g_i(\boldsymbol x) gi(x)是凹函数, h j ( x ) h_j(x) hj(x)是线性函数。
定理
\quad 设 S S S是 R n R^n Rn中非空凸集, f f f是定义在 S S S上的凸函数,则 f f f在 S S S上的局部极小点是全局极小点,且极小点的集合为凸集。
凸集分离定理
定理1
\quad 设 S S S为 R n R^n Rn中的闭凸集, y ∉ S \boldsymbol y\notin S y∈/S,使得 x ˉ ∈ S \boldsymbol{\bar{x}}\in S xˉ∈S,使得: ∥ y − x ˉ ∥ = inf x ∈ S ∥ y − x ∥ \parallel \boldsymbol y- \boldsymbol{\bar{x}} \parallel=\inf_{x\in S}\parallel \boldsymbol y-\boldsymbol x\parallel ∥y−xˉ∥=x∈Sinf∥y−x∥
定理2
\quad 设 S S S是 R n R^n Rn中的非空闭凸集, y ∉ S \boldsymbol y\notin S y∈/S,则存在非零向量 p \boldsymbol p p及数 ξ > 0 \xi>0 ξ>0,使得对每个点 x ∈ S \boldsymbol x\in S x∈S,成立 p T y ≥ ξ + p T x \boldsymbol{p^Ty}\geq \xi+\boldsymbol{p^Tx} pTy≥ξ+pTx。
定理3
\quad 设 S S S是 R n R^n Rn中的非空凸集, y ∈ ∂ S \boldsymbol y\in \partial S y∈∂S,则存在非零向量 p \boldsymbol p p,使得对每个点 x ∈ c l S \boldsymbol x\in cl S x∈clS,成立 p T y ≥ p T x \boldsymbol{p^Ty}\geq \boldsymbol{p^Tx} pTy≥pTx。其中 ∂ S \partial S ∂S表示 S S S集合边界, c l S clS clS表示 S S S集合的闭包(由 S S S的内点和边界点组成)。
分离定理
\quad 设 S 1 S_1 S1和 S 2 S_2 S2是 R n R^n Rn中两个非空凸集, S 1 ∩ S 2 = ∅ S_1\cap S_2=\emptyset S1∩S2=∅,则存在非零向量 p \boldsymbol p p,使 inf { p T x ∣ x ∈ S 1 } ≥ sup { p T x ∣ x ∈ S 2 } \inf\{\boldsymbol{p^Tx} |\boldsymbol x\in S_1\} \geq \sup\{\boldsymbol{p^Tx}|\boldsymbol x\in S_2\} inf{pTx∣x∈S1}≥sup{pTx∣x∈S2}
Farkas定理
\quad 设 A \boldsymbol A A为 m × n m\times n m×n矩阵, c \boldsymbol c c为 n n n维向量,则 A x ≤ 0 , c T x > 0 \boldsymbol{Ax}\leq \boldsymbol 0,\boldsymbol {c^Tx}\gt0 Ax≤0,cTx>0有解的充分条件是 A T y = c , y ≥ 0 \boldsymbol{A^Ty=c},\boldsymbol y\geq\boldsymbol 0 ATy=c,y≥0无解。
Gordan定理
\quad 设 A \boldsymbol A A为 m × n m\times n m×n矩阵,那么 A x < 0 \boldsymbol{Ax}<\boldsymbol 0 Ax<0有解的充要条件是不存在非零向量 y ≥ 0 \boldsymbol{y\geq 0} y≥0,使 A T y = 0 \boldsymbol{A^Ty=0} ATy=0。
对偶定理
原问题
min f ( x ) s . t . g ( x ) ≥ 0 h ( x ) = 0 x ∈ D \begin{aligned} &\min &&f(\boldsymbol x)\\ &s.t. &&\boldsymbol{g(x)\geq 0}\\ &&&\boldsymbol{h(x)=0}\\ &&&\boldsymbol x\in D \end{aligned} mins.t.f(x)g(x)≥0h(x)=0x∈D
对偶问题
max θ ( w , v ) s . t . w ≥ 0 \begin{aligned} &\max &&\theta(\boldsymbol {w,v})\\ &s.t. &&\boldsymbol{ w\geq 0} \end{aligned} maxs.t.θ(w,v)w≥0
\quad 其中对偶函数 θ ( w , v ) = inf { f ( x ) − w T g ( x ) − v T h ( x ) ∣ x ∈ D } \theta(\boldsymbol{w,v})=\inf\{f(\boldsymbol x)-\boldsymbol{w^Tg(x)-v^Th(x)}|\boldsymbol x\in D\} θ(w,v)=inf{f(x)−wTg(x)−vTh(x)∣x∈D}。
弱对偶定理
\quad 设 x \boldsymbol x x和 ( w , v ) \boldsymbol{(w,v)} (w,v)分别是原问题和对偶问题的可行解,则:
f ( x ) ≥ θ ( w , v ) f(\boldsymbol x)\geq \theta \boldsymbol{(w,v)} f(x)≥θ(w,v)
推论1
\quad 对于原问题和对偶问题,必有:
inf { f ( x ) ∣ g ( x ) ≥ 0 , h ( x ) = 0 , x ∈ D } ≥ sup { θ ( w , v ) ∣ w ≥ 0 } \inf \{f(\boldsymbol x)|\boldsymbol{g(x)\geq0,h(x)=0,x\in}D\}\geq\sup\{\theta\boldsymbol{(w,v)}|\boldsymbol{w \geq 0}\} inf{f(x)∣g(x)≥0,h(x)=0,x∈D}≥sup{θ(w,v)∣w≥0}
推论2
\quad 如果 f ( x ˉ ) ≤ θ ( w ˉ , v ˉ ) f(\boldsymbol{\bar{x}}) \leq\theta\boldsymbol{(\bar{w},\bar{v})} f(xˉ)≤θ(wˉ,vˉ),其中:
x ˉ ∈ { x ∣ g ( x ) ≥ 0 , h ( x ) = 0 , x ∈ D } , w ˉ ≥ 0 \boldsymbol{\bar{x}}\in \{\boldsymbol x|\boldsymbol{g(x)\geq0,h(x)=0,x\in}D\},\quad \boldsymbol{\bar{w}}\geq\boldsymbol0 xˉ∈{x∣g(x)≥0,h(x)=0,x∈D},wˉ≥0
\quad 则 x ˉ \boldsymbol{\bar{x}} xˉ和 ( w ˉ , v ˉ ) \boldsymbol{(\bar{w}, \bar{v})} (wˉ,vˉ)分别是原问题和对偶问题的最优解。
推论3
\quad 如果
inf { f ( x ) ∣ g ( x ) ≥ 0 , h ( x ) = 0 , x ∈ D } = − ∞ \inf \{f(\boldsymbol x)|\boldsymbol{g(x)\geq0,h(x)=0,x\in}D\}=-\infty inf{f(x)∣g(x)≥0,h(x)=0,x∈D}=−∞
\quad 则对每一个 w ≥ 0 \boldsymbol{w\ge0} w≥0,有
θ ( w , v ) = − ∞ \theta\boldsymbol{(w,v)}=-\infty θ(w,v)=−∞.
推论4
\quad 如果
sup { θ ( w , v ) ∣ w ≥ 0 } = ∞ \sup\{\theta\boldsymbol{(w,v)}|\boldsymbol{w \geq 0}\}=\infty sup{θ(w,v)∣w≥0}=∞
\quad 则原问题没有可行解。
引理
\quad 设 D D D是 R n R^n Rn中一个非空凸集, φ ( x ) 和 g i ( x ) ( i = 1 , ⋯ m ) 分 别 是 \varphi(\boldsymbol x)和g_i(\boldsymbol x)(i=1,\cdots m)分别是 φ(x)和gi(x)(i=1,⋯m)分别是 R n R^n Rn上的凸函数和凹函数, h j ( x ) ( j = 1 , ⋯ l ) h_j(\boldsymbol x)(j=1,\cdots l) hj(x)(j=1,⋯l)是 R n R^n Rn上的线性函数,即假设: h ( x ) = A x − b \boldsymbol{h(x)=Ax-b} h(x)=Ax−b
\quad 那么下列两个系统中,若系统1无解,则系统2必有解 ( w 0 , w , v ) (w_0,\boldsymbol w,\boldsymbol v) (w0,w,v);反之,若系统2有解 ( w 0 , w , v ) (w_0,\boldsymbol w,\boldsymbol v) (w0,w,v), w 0 > 0 w_0\gt0 w0>0,则系统1无解。
\quad 系统1 \quad 存在 x ∈ D \boldsymbol x\in D x∈D,使得 φ ( x ) < 0 , g ( x ) ≥ 0 , h ( x ) = 0 \varphi(\boldsymbol x)<0\boldsymbol{,g(x)\ge0,h(x)=0} φ(x)<0,g(x)≥0,h(x)=0;
\quad 系统2 \quad w 0 φ ( x ) − w T g ( x ) − v T h ( x ) ≥ 0 , ∀ x ∈ D , ( w 0 , w ) ≥ 0 , ( w 0 , w , v ) ≠ 0 w_0\varphi(\boldsymbol x)-\boldsymbol{w^Tg(x)-v^Th(x)}\ge0,\forall\boldsymbol x\in D,(w_0,\boldsymbol w)\ge\boldsymbol0,(w_0\boldsymbol{,w, v})\neq\boldsymbol 0 w0φ(x)−wTg(x)−vTh(x)≥0,∀x∈D,(w0,w)≥0,(w0,w,v)=0
强对偶定理
\quad 设 D D D是 R n R^n Rn中一个非空凸集, f f f和 g i ( i = 1 , ⋯ m ) g_i(i=1,\cdots m) gi(i=1,⋯m)分别是 R n R^n Rn上的凸函数和凹函数, h j ( j = 1 , ⋯ l ) h_j(j=1,\cdots l) hj(j=1,⋯l)是 R n R^n Rn上的线性函数,即 h ( x ) = A x − b \boldsymbol{h(x)=Ax-b} h(x)=Ax−b,又设存在点 x ^ ∈ D \hat{\boldsymbol x}\in D x^∈D,使得
g ( x ^ ) > 0 , h ( x ^ ) = 0 , 0 ∈ i n t H ( D ) H ( D ) = { h ( x ) ∣ x ∈ D } \boldsymbol{g(\hat{x})\gt0,h(\hat{x})=0,0\in }int H(D)\quad H(D)=\{\boldsymbol{h(x)}|\boldsymbol x\in D\} g(x^)>0,h(x^)=0,0∈intH(D)H(D)={h(x)∣x∈D}
\quad 则:
inf { f ( x ) ∣ g ( x ) ≥ 0 , h ( x ) = 0 , x ∈ D } = sup { θ ( w , v ) ∣ w ≥ 0 } \inf \{f(\boldsymbol x)|\boldsymbol{g(x)\geq0,h(x)=0,x\in}D\}= \sup\{\theta\boldsymbol{(w,v)}|\boldsymbol{w \geq 0}\} inf{f(x)∣g(x)≥0,h(x)=0,x∈D}=sup{θ(w,v)∣w≥0}
\quad 而且,若式中 i n f inf inf为有限值,则:
sup { θ ( w , v ) ∣ w ≥ 0 } \sup\{\theta\boldsymbol{(w,v)}|\boldsymbol{w \geq 0}\} sup{θ(w,v)∣w≥0}
\quad 在 ( w ˉ , v ˉ ) \boldsymbol{(\bar{w},\bar{v})} (wˉ,vˉ)(在证明过程中得到的变量)达到, x ˉ ≥ 0 \boldsymbol{\bar{ x}\ge0} xˉ≥0。如果 i n f inf inf在点 x ˉ \boldsymbol{\bar{x}} xˉ达到,则 w ˉ T g ( x ˉ ) = 0 \boldsymbol{\bar{w}^Tg(\bar{x})}=0 wˉTg(xˉ)=0。
鞍点定理
原问题
min f ( x ) , x ∈ R n s . t . g ( x ) ≥ 0 h ( x ) = 0 \begin{aligned} &\min &&f(\boldsymbol x) , \quad \boldsymbol x\in R^n \\ &s.t. &&\boldsymbol{g(x)\geq 0}\\ &&&\boldsymbol{h(x)=0} \end{aligned} mins.t.f(x),x∈Rng(x)≥0h(x)=0
对偶问题
max θ ( w , v ) s . t . w ≥ 0 \begin{aligned} &\max &&\theta(\boldsymbol {w,v})\\ &s.t. &&\boldsymbol{ w\geq 0} \end{aligned} maxs.t.θ(w,v)w≥0
\quad 其中对偶函数 θ ( w , v ) = inf { f ( x ) − w T g ( x ) − v T h ( x ) ∣ x ∈ R n } \theta(\boldsymbol{w,v})=\inf\{f(\boldsymbol x)-\boldsymbol{w^Tg(x)-v^Th(x)}|\boldsymbol x\in R^n\} θ(w,v)=inf{f(x)−wTg(x)−vTh(x)∣x∈Rn}。
鞍点定义
\quad 设 L ( x , w , v ) L(\boldsymbol{x,w,v}) L(x,w,v)为 L a g r a n g e Lagrange Lagrange函数, x ˉ ∈ R n , w ˉ ∈ R m , w ˉ ≥ 0 , v ˉ ∈ R l \bar{\boldsymbol x}\in R^n,\bar{\boldsymbol w}\in R^m,\boldsymbol{\bar{ w}\ge0},\boldsymbol{\bar{v}}\in R^l xˉ∈Rn,wˉ∈Rm,wˉ≥0,vˉ∈Rl,如果对每个 x ∈ R n , w ∈ R m , w ≥ 0 及 v ∈ R l \boldsymbol x\in R^n,\boldsymbol w\in R^m,\boldsymbol{w\ge0}及\boldsymbol v \in R^l x∈Rn,w∈Rm,w≥0及v∈Rl,都有
L ( x ˉ , w , v ) ≤ L ( x ˉ , w ˉ , v ˉ ) ≤ L ( x , w ˉ , v ˉ ) L(\boldsymbol{\bar{x}, w, v})\le L(\boldsymbol{\bar{x}, \bar{w}, \bar{v}})\le L(\boldsymbol{x, \bar{w}, \bar{v}}) L(xˉ,w,v)≤L(xˉ,wˉ,vˉ)≤L(x,wˉ,vˉ)
\quad 则称 ( x ˉ , w ˉ , v ˉ ) (\boldsymbol{\bar{x}, \bar{w}, \bar{v}}) (xˉ,wˉ,vˉ)为 L ( x , w , v ) L(\boldsymbol{x, w, v}) L(x,w,v)的鞍点。
鞍点定理
\quad 设 ( x ˉ , w ˉ , v ˉ ) (\boldsymbol{\bar{x},\bar{w},\bar{v}}) (xˉ,wˉ,vˉ)是原问题的 l a g r a n g e lagrange lagrange函数 L ( x , w , v ) L(\boldsymbol{x, w, v}) L(x,w,v)的鞍点,则 x ˉ \boldsymbol{\bar{x}} xˉ和 ( w ˉ , v ˉ ) \boldsymbol{(\bar{w}, \bar{v})} (wˉ,vˉ)分别是原问题和对偶问题的最优解。
\quad 反之,假设 f f f是凸函数, g i ( i = 1 , ⋯ , m ) g_i(i=1, \cdots,m) gi(i=1,⋯,m)是凹函数, h j ( j = 1 , ⋯ l ) h_j(j=1, \cdots l) hj(j=1,⋯l)是线性函数,即 h ( x ) = A x − b \boldsymbol{h(x)=Ax-b} h(x)=Ax−b,且 A A A满秩,又设存在 x ^ \boldsymbol{\hat{x}} x^,使 g ( x ^ ) > 0 , h ( x ^ ) = 0 \boldsymbol{g(\hat{x})\gt0,h(\hat{x})=0} g(x^)>0,h(x^)=0。如果 x ˉ \boldsymbol{\bar{x}} xˉ是原问题的最优解,则存在 ( w ˉ , v ˉ ) , w ˉ ≥ 0 (\boldsymbol{\bar{w}, \bar{v}}),\boldsymbol{\bar{w}\ge0} (wˉ,vˉ),wˉ≥0,使得 ( x ˉ , w ˉ , v ˉ ) (\boldsymbol{\bar{x},\bar{w},\bar{v}}) (xˉ,wˉ,vˉ)是 l a g r a n g e lagrange lagrange函数 L ( x , w , v ) L(\boldsymbol{x, w, v}) L(x,w,v)的鞍点。
本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!