最优控制——变分法

最优控制——变分法第一章最优控制基础1、一般的最优化问题要最小化的性能指标定义在数域上,而变分问题的性能指标(目标泛函)的定义域是函数的集合。2、泛函:从任意定义域到实数域或复数域的映射。泛函的定义域是函数集,

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺

 

第一章 最优控制基础

1、一般的最优化问题要最小化的性能指标定义在数域上,而变分问题的性能指标(目标泛函)的定义域是函数的集合。

2、 泛函:从任意定义域到实数域或复数域的映射。泛函的定义域是函数集,值域是数集,也就是说,泛函是从函数空间到数域的一个映射

3、最优控制问题的四个基本元素:状态方程、容许控制、目标集、性能指标

其中状态方程(关于状态变量和控制变量的常微分方程)

最优控制——变分法

 

是最优控制问题与经典变分问题的重要区别之一

4、经典变分问题需要连续的控制变量—>之后的极小值原理处理不连续控制变量、状态变量或者控制变量有约束的情况—>更复杂的非线性状态方程、控制变量不可微等      动态规划方法

5、无确定模型的最优控制方法:强化学习与自适应动态规划、模型预测控制、微分博弈、平行控制

第二章 最优控制方法

1、直接变分法 实质:以函数为输入,以实数为输出

在局部范围内对最优解加以”扰动“,再考察性能指标是否发生变化。利用微积分取极限的思想。

(链式法则,先对x求,再对x’求,以及分步积分巴拉巴拉复习一下最优控制——变分法

2、拉格朗日的delata方法,加以扰动,对比最优曲线和扰动后的曲线,看新的性能指标是不是会<最优的,若是极值点,这个增量应该总是>=0的,在该点足够小的邻域内是几乎为0的

最优控制——变分法

得出

最优控制——变分法 

问题:可能导致扰动后x落在定义域之外,结论不再有效

3、拉格朗日乘子法和KKT条件

 

第三章 变分法

1、函数变分:函数的增量 delta x    

泛函增量:J(x+delta x)-J(x)    类比计算极值的时候函数值的差

线性泛函:若满足齐次性条件和可加性条件,则称之为线性泛函

若泛函增量可以写成函数变分的线性泛函及其高阶无穷小项的两部分加和,则称泛函对函数x可微,且其中的线性泛函就是泛函变分。

2、泛函极值的必要条件

驻点条件:泛函变分为0(反证法,前提是定义域是开集) 

适用场景:控制变量可在全空间中任意取值没有约束,容许控制为连续函数全体。

不适用场景:控制变量或其分量取值于实数空间中的闭区间

3、最简变分法:(欧拉-拉格朗日方程)

最优控制——变分法

 

求变分不止可以用看线性泛函和高阶无穷小,还可以用微积分的方法求解:

最优控制——变分法

 

4、 欧拉-拉格朗日方程是关于状态x的二阶微分方程

分为三种情况:

最优控制——变分法三种结果:

最优控制——变分法

最优控制——变分法

 

最优控制——变分法

5、hamilton方程组

物理学家将欧拉-拉格朗日这个二阶微分方程化成了一阶常微分方程组

6、等式约束的处理

拉格朗日乘子法

最优控制——变分法

 

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/167735.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)
blank

相关推荐

  • resnet是卷积神经网络吗_神经网络架构搜索的应用

    resnet是卷积神经网络吗_神经网络架构搜索的应用卷积神经网络在图像识别方面应用广泛,在实际应用在中,识别的准确率不仅仅与数据量有关,还与模型的架构有很大的关联。从首个成功应用于数字识别的卷积神经网络LeNet,到卷积神经网络崛起点AlexNet,以及陆陆续续的ZFNet,VGGNet,Inception系列和ResNet,这些架构在网络深度,宽度,卷积核大小和可视化部分都做了很大的改进,使得卷积神经网络的性能越来越强。

  • Winrunner经验[通俗易懂]

    Winrunner经验[通俗易懂] winrunner经验总结1.1脚本录制规范:基本原则是录制脚本要分开、gui文件要合并、批调用回放验证、可移植回放验证。1.1.1录制脚本要分开:脚本太大,不仅不利于以后的维护,并且会导致WinRunner的不可预测的错误产生(具体可以参考WinRunner的Readme文档)。录制时,可以根据测试用例的流程,拆分为几个小流程,对每个小流程分别录制成不同的脚本。1.1.2gui文件要合

    2022年10月27日
  • [转载]Asp.net MVC 2 + Castle + NHibernate 项目实战(1)

    [转载]Asp.net MVC 2 + Castle + NHibernate 项目实战(1)

  • Word2vec负采样

    Word2vec负采样下文中的模型都是以Skip-gram模型为主。1、论文发展word2vec中的负采样(NEG)最初由Mikolov在论文《DistributedRepresentationsofWordsandPhrasesandtheirCompositionality》中首次提出来,是Noise-ContrastiveEstimation(简写NCE,噪声对比估计)的简化版本…

  • onmouseout和onmousemove

    onmouseout和onmousemoveonmouseout和onmousemoveonmouseout事件会在鼠标指针移出指定的对象时发生。onmousemove事件会在鼠标指针移动时发生。

    2022年10月19日
  • 很黄色的JAVA游戏_《yellow》很黄!很暴力?居然有这么黄的游戏!

    很黄色的JAVA游戏_《yellow》很黄!很暴力?居然有这么黄的游戏!原标题:《yellow》很黄!很暴力?居然有这么黄的游戏!《yellow》是一款很“黄”但是一点也不暴力的解密益智类游戏,游戏一共有50关,每一关都非常非常的黄,不适宜长时间玩耍~游戏虽好玩但是要适度哦~游戏的特色就是黄,一打开游戏游戏的界面就和游戏的名字一样,玩家要通过自己的脑洞来进行通关,通关的方法也和游戏的名字一样,只要让游戏界面全部变黄了就能通关了,游戏的解密相对其他解密游戏简直亲切,…

    2022年10月15日

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号