大家好，又见面了，我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全家桶1年46，售后保障稳定

前言

这篇博客旨在介绍下最近在通信中经常用到的 ADMM 算法。算法的全称为 Alternating Direction Method of Multipliers, 中文直译为： 交替方向乘子法。本文的参考文献为 Boyd 的经典著作： Distributed Optimization and Statistical Learning via the Alternating Direction Method of Multipliers，事实上从名字就可以看出，正如Boyd在摘要中所提到的， ADMM算法的优势是可以将问题进行分布式优化，从而解决大规模计算问题。然而在通信的应用中，更多时候则是把一个多变量问题进行解耦，通过对每个单变量进行迭代求解来简化问题本身。

对偶上升法与增广拉格朗日乘数法

在介绍ADMM算法前，我想先简要介绍下对偶上升法与增广拉格朗日乘数法，两者可以视为ADMM算法的前身或简化版本，而ADMM算法则又可视为两者的结合体。

对偶上升法

对偶上升法，在之前的博客中有更为详细的介绍，对偶上升法 (Dual Ascent)。这里我们只简述其核心。对于一个等式约束的凸优化问题如下：
$\begin{array}{ll} \operatorname{minimize} & f(x) \\ \text { subject to } & A x=b, \end{array}$
其中， $f (x)$ 为凸函数。我们可以通过拉格朗日乘子法将限制条件写入目标函数中，从而得到：
$L(x, y)=f(x)+y^{T}(A x-b)$

那么，其对偶函数为：
$g(y)=\inf _{x} L(x, y)$
相应的对偶问题为：
$\text { maximize } g(y)$
对偶上升法表示，通过如下的步骤：
$\begin{aligned} &x^{k+1}:=\underset{x}{\operatorname{argmin}} L\left(x, y^{k}\right) \\ &y^{k+1}:=y^{k}+\alpha^{k}\left(A x^{k+1}-b\right), \end{aligned}$
等价于求解对偶问题。这里 $\alpha_k$ 为步长。而从步骤的形式上看，就是简单的先固定 $y$ 优化 $x$ ，再固定 $x$ 优化 $y$ 。但是是可以保证收敛的。可以看到，对偶上升法的优点是可以将多变量解耦开来。值得一提的是，迎合ADMM类所期望的分布式优化的特点，对偶上升法也可以通过将变量分解为多个维度较低的变量再进行并行求解，此时优化步骤变为：
$\begin{aligned} x_{i}^{k+1} &:=\underset{x_{i}}{\operatorname{argmin}} L_{i}\left(x_{i}, y^{k}\right) \\ y^{k+1} &:=y^{k}+\alpha^{k}\left(A x^{k+1}-b\right) \end{aligned}$
即将原高维变量 $x$ 拆分成了多个低维变量 $x_i$ 进行依次优化。 在多个变量之间交替优化，迭代求解，可以说是ADMM类算法贯彻的准则。

增广拉格朗日乘数法

增广拉格朗日乘数法可以看做是对偶上升法的进阶，但也不完全是。他将拉格朗日函数写为：
$L_{\rho}(x, y)=f(x)+y^{T}(A x-b)+(\rho / 2)\|A x-b\|_{2}^{2}$
可以看到，相比于普通的拉格朗日函数（比如刚刚对偶上升法中所给出的），他多了第三项，其中 $\rho$ 为惩罚参数。显然当 $x$ 为最优值时， $A x - b = 0$ ，因此这两个拉格朗日函数其实是相等的。但是在迭代过程中，有了这一项惩罚项后，无论 $f (x)$ 本身是否强凸，由于增加了一个强凸惩罚项，因此这个增广拉格朗日函数可视作 $x$ 的强凸函数， 从而对算法的收敛更有帮助。增广拉格朗日乘数法的步骤为：
$\begin{aligned} x^{k+1} &:=\underset{x}{\operatorname{argmin}} L_{\rho}\left(x, y^{k}\right) \\ y^{k+1} &:=y^{k}+\rho\left(A x^{k+1}-b\right) \end{aligned}$
注意到，这几乎和对偶上升的步骤完全一致。但除了目标函数的改变之外（增加了惩罚项），另一个变化是步长默认为是惩罚参数 $\rho$ 。这样的选取是有其道理的，具体可以参见boyd的书，是从收敛性的角度进行了考虑。总之，增广拉格朗日乘数法改善了收敛性能，但同时由于增加了这一项，因此无法拆分为多个 $x_i$ 进行分布式并行求解。

ADMM算法

结合了对偶上升法的可拆解性和增广拉格朗日乘数法的易收敛性， ADMM算法呼之欲出。我们将优化变量拆分为独立的两部分， $x$ 和 $z$ ，那么问题可以改写为：
$\begin{array}{ll} \operatorname{minimize} & f(x)+g(z) \\ \text { subject to } & A x+B z=c \end{array}$
这里 $f$ 和 $g$ 都是凸函数。此时，其对应的增广拉格朗日函数为：
$L_{\rho}(x, z, y)=f(x)+g(z)+y^{T}(A x+B z-c)+(\rho / 2)\|A x+B z-c\|_{2}^{2}$
而其优化步骤为：
$\begin{aligned} x^{k+1}:=& \underset{x}{\operatorname{argmin}} L_{\rho}\left(x, z^{k}, y^{k}\right) \\ z^{k+1}:=& \operatorname{argmin} L_{\rho}\left(x^{k+1}, z, y^{k}\right) \\ y^{k+1}:=& y^{k}+\rho\left(A x^{k+1}+B z^{k+1}-c\right) \end{aligned}$
可以清晰的看到，这正是对偶上升法与增广拉格朗日乘数法的结合体。理论上可以进一步把优化变量拆分为更多的block，如 $x$ , $z$ , $z_1$ , $\cdots$ 。如果我们将原问题的最优解表示为：
$p^{\star}=\inf \{f(x)+g(z) \mid A x+B z=c\}$
那么ADMM算法在满足很基本的假设的情况下， 可以确保：
$f\left(x^{k}\right)+g\left(z^{k}\right) \rightarrow p^{\star} \text { as } k \rightarrow \infty$
这也体现了算法的收敛性，即最终得到全局最优解。这在boyd的著作中给出了详尽的证明。

ADMM算法的Scaled Form

ADMM算法还有另一种常见形式。如果我们令 $r = A x + B z - c$ 来代表当前值与实际约束间的残差，那么我们有：
$\begin{aligned} y^{T} r+(\rho / 2)\|r\|_{2}^{2} &=(\rho / 2)\|r+(1 / \rho) y\|_{2}^{2}-(1 / 2 \rho)\|y\|_{2}^{2} \\ &=(\rho / 2)\|r+u\|_{2}^{2}-(\rho / 2)\|u\|_{2}^{2} \end{aligned}$
其中， $\rho) y$ 代表被 scaled 后的对偶变量，这也是所谓 scaled form的由来。由此， ADMM步骤可以被简化写为：

$\begin{aligned} x^{k+1} &:=\underset{x}{\operatorname{argmin}}\left(f(x)+(\rho / 2)\left\|A x+B z^{k}-c+u^{k}\right\|_{2}^{2}\right) \\ z^{k+1} &:=\underset{z}{\operatorname{argmin}}\left(g(z)+(\rho / 2)\left\|A x^{k+1}+B z-c+u^{k}\right\|_{2}^{2}\right) \\ u^{k+1} &:=u^{k}+A x^{k+1}+B z^{k+1}-c . \end{aligned}$
可以看到一次项已经被写进 $^2$ 中了。

ADMM算法的收敛性

发布者：全栈程序员-用户IM，转载请注明出处：https://javaforall.cn/213456.html原文链接：https://javaforall.cn

【正版授权，激活自己账号】： Jetbrains全家桶Ide使用，1年售后保障，每天仅需1毛

【官方授权正版激活】： 官方授权正版激活支持Jetbrains家族下所有IDE 使用个人JB账号...

ADMM算法简介_RMA算法

前言

对偶上升法与增广拉格朗日乘数法

对偶上升法

增广拉格朗日乘数法

ADMM算法

ADMM算法的Scaled Form

ADMM算法的收敛性

发表回复

ADMM算法简介_RMA算法

前言

对偶上升法与增广拉格朗日乘数法

对偶上升法

增广拉格朗日乘数法

ADMM算法

ADMM算法的Scaled Form

ADMM算法的收敛性

相关推荐

DB监控简易脚本

web前端技术讲解之CSS中position的定位技术

950. 郁闷的出纳员(Splay树)「建议收藏」

c语言中的双周期指令,时钟周期 机器周期 指令周期的概念[通俗易懂]

Android 编译_android线程

c语言函数指针的用法_函数指针作为形参

发表回复

c语言中的双周期指令,时钟周期机器周期指令周期的概念[通俗易懂]