3-极大值原理

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第三章极大值原理(MaximumPrinciple)前面介绍的变分法属于经典变分学的内容。经典变分学只能解决容许控制属于开集的一类最优控制问题,而且对轨线x(t)、函数L、f均有连续可微要求。实际工程应用问题中,这些要求一般无法得到满足。为解决容许控制属于闭集的一类最优控制问题,前苏联数学家庞特里亚金(俄文ЛОНТЛЯТИН,英文Pontryagin)受力学中Hamilton原理启发,于1958年提出极大值原理并加以证明。极大值原理将经典变分学推进到现代变分学,成为现代控制理论的重要基石。极大值原理(MaximumPrinciple),或称最大值原理,也有称为极小值原理或最小值原理(MinimumPrinciple)。极大值原理的证明在数学上非常严格,本课程只从工程应用需要的理解程度出发对其进行简单推导。3.1泛函极值的充分条件几个有关定义正常场定义3-1:若(t,x)平面某一区域D上每一点都有曲线族中一条且仅有一条通过,则称曲线族在区域D上形成一个正常场。曲线族上点(t,x)处的切线的角系数称为场在点(t,x)的斜率。中心场定义3-2:若区域D上曲线族的全部曲线都通过一点(t0,x0),即它们形成曲线束,且束心也属于D,同时除束心外,曲线在D内不再相交,曲线布满区域D,则该场为中心场。极值曲线场定义3-3:若正常场或中心场是由某一变分问题的极值曲线族所形成,则称之为极值曲线场。设有泛函若用p(x,t)表示其极值曲线场中极值曲线斜率,则可以证明泛函增量可表示为fttdtttxtxLxJ0]),(),([)(fttdtttxptxtxExJ0]),,(),(),([)(],,[][],,[],,[],,,[tpxLppxtpxLtxxLtpxxE其中称为维尔斯特拉斯E函数。维尔斯特拉斯E函数(WeierstrassErdmannFunction)泛函J在曲线上达到极值的充分条件设泛函J在曲线c上达到极值,可分为弱极值和强极值两种情况,其充分条件分别为:对于弱极值,①曲线c应是满足极值条件的极值曲线;②极值曲线c能够被包含在极值曲线场中;③对于c近旁所有点(x,t)以及近于p(x,t)的值,函数不变号,极小值时E≥0,极大值时E≤0。对于强极值,①曲线c应是满足极值条件的极值曲线;②极值曲线c能够被包含在极值曲线场中;③对于c近旁所有点(x,t)以及任意的值,函数不变号,极小值时E≥0,极大值时E≤0。x),,,(tpxxEx),,,(tpxxE3.2连续系统极大值原理考虑系统状态方程(3-2-1)其中,,m≤n]),(),([)(ttutxftxmnRtuRtx)(,)(初始状态(3-2-2)00)(xtx终态满足(3-2-3)其中,,r≤n。0]),([ffttxrRu(t)属于有界闭集Ω,受不等式≥0(3-2-4)约束,g为p维连续可微函数,p≤m。]),(),([ttutxg求最优控制,满足上列条件,并使性能指标(3-2-5)达到极小值。)(*tufttffdtttutxLttxuJ0)]),(),([]),([)(u(t)有界并受不等式约束,与前面讨论的问题不同。•取可以保证g非负;而由u(t)的分段连续性,有的分段连续性,则进一步有w(t)分段光滑连续。因此,可以采用Lagrange乘子法进行求解。u(t)有界一般可以考虑为是分段连续函数,对不等式约束则要设法转化为等式约束处理。引进新变量Z(t)和w(t),取(3-2-6)(3-2-7)0)(],),(),([)]([02tZttutxgtZ0)(),()(0twtutwgZ2)(tw•分别取Lagrange乘子,,,构造广义性能指标(3-2-8)nRrRpRfttffffadtZtwxgxtwxftwxLttxtttxuJ0]}),,([]),,([),,({]),([)(]),([)(2TTT求其一阶变分有(3-2-12)定义(3-2-9)(3-2-10)则有(3-2-11)其中(3-2-13)),,(),,(),,,(twxftwxLtwxHT]),,([),,,(),,,,,,(2ZtwxgxtwxHtZwxxFTTfttffffadttZwxxFttxtttxuJ0),,,,,,(]),([)(]),([)(TZwxtaJJJJJfftfftttftfttFtttFdttJffffff}{}{TT式(3-2-14)中,由于,则有(3-2-14’)(3-2-15)(3-2-16)ffftxtxx)(fffttfttfxdtxFdtdxFxtxFxxFxxxJ0][)(}{TTTTfftttwdtwFdtdwwFwJ0])(TTfftttZdtZFdtdZZFZJ0])(TT(3-2-14)}][){(}{}{}{00fffffttttftttfxdtxFdtdxFxxFxxxxdtxFxxFxxxJTTTTTTTT由泛函极值必要条件及的任意性,得此泛函极值的必要条件为:欧拉方程:(3-2-17)(3-2-18)(3-2-19)横截条件:(3-2-20)(3-2-21)(3-2-22)(3-2-23)0xFdtdxF0wFdtd0ZFdtd0}{ftffxFxFttTT0}{ftxFxxT0ftwF0ftZF0aJZwxxtff,,,,将代入以上各式,可得泛函极值必要条件为:欧拉方程:(3-2-24)(3-2-25)(3-2-26)横截条件:(3-2-27)(3-2-28)(3-2-29)(3-2-30)xgxHT0}{wgwHdtdT0)(ZdtdT0}{ftffHttT0}{ftxxT0}{ftwgwHT0)(ftZT]),,([),,,(),,,,,,(2ZtwxgxtwxHtZwxxFTT将F函数定义式(3-2-10)代入上式,并考虑由和,有;由和,有,以及在最优轨线上有,所以有再由3.1节中泛函达到极值的充分条件,维尔斯特拉斯E函数在泛函极小值时沿最优轨线非负,即有(3-2-31)0)()()(),,,,,(),,,,,(************ZFZZwFwwxFxxZwxZwxFZwxZwxFETTT0wFdtd0ftwF0wF0ZFdtd0ftZF0ZF),,(2tuxgZ0),,,(),,,(*****twxHtwxHE(3-2-32)0),,,(),,,(*****twxHtwxHE(3-2-32)考虑,上式即(3-2-33)uw),,,(),,,(*****tuxHtuxH或(3-2-33’)),,,(min),,,(*****tuxHtuxHu以上即为极大值原理的简单推导。至此可以将庞特里亚金极大值原理表示为:控制变量u(t)是有第一类间断点的分段连续函数,属于m维空间中的有界闭集Ω,满足不等式约束条件≥0(3-2-4)定理3-1:设系统的状态方程为(3-2-1)]),(),([)(ttutxftx]),(),([ttutxg则为把状态x(t)自初始状态(3-2-2)转移到满足边界条件(3-2-3)的终态,其中tf未知,并使性能指标(泛函)(3-2-5)达到最小值,实现最优控制的条件是:00)(xtx0]),([ffttxfttffdtttutxLttxuJ0)]),(),([]),([)((1)设u*(t)是最优控制,x*(t)为由此最优控制产生的最优轨线,则存在与其相对应的协态向量λ*(t),使x*(t)和λ*(t)满足规范方程组(3-2-34)(2)在最优轨线上与最优控制u*(t)对应的Hamilton函数取最小值(3-2-35)]),(),(),([)(]),(),(),([)(********ttuttxHxtttuttxHtx]),(),(),([min]),(),(),([*****ttuttxHttuttxHu(3)Hamilton函数在最优轨线终点处的值由下式决定(3-2-36)(4)协态向量λ*(t)的终值满足横截条件(3-2-37)0}{ftffttHT(5)状态向量x*(t)满足边界条件(3-2-38)ftfxxt}{)(*T0]),([)(00ffttxxtx3.3极大值原理边界条件的几种典型情况以下几种典型情况的分析将有助于解决实际问题,特别是如何确定解规范方程组的边界条件。(1),固定,tf自由0]),([ffttxffxtx)(由于和不显含tf,由(3-2-36)式有,这为确定tf提供了一个条件;又由(3-2-37)式有,即在终点处对λ无约束。0]),([ffttx0)(]),([ffffxtxttx0ftH)(ft这时,因和已经为规范方程组提供了2n个边界条件,无需λ(t)的任何约束。00)(xtxffxtx)(此时有,h为n-k维连续可微向量函数。因为不显含tf,由(3-2-36)式有。由(3-2-37)式有,即各λi*(t)是的线性组合。(2),受n-k个方程约束,tf自由0]),([ffttx)(ftx)]([]),([ffftxhttx0)]([]),([ffftxhttx0ftHknfknfffftxhtxhtxhtxht2121*])(,;)(,)([)()(T)(fitxh考虑特殊情况,则有knixtxtxhiffifi,,2,1,)()]([knitifi,,2,1,)(*nknitfi,,1,0)(*即状态终值为规范方程组提供n-k个边界条件,其余k个边界条件由协态终值提供。(3),不受约束,tf自由这时,有,,即协态终值为规范方程组提供所需的n个边界条件。0]),([ffttx)(ftx0]),([ffttx0ftH0)(*ft(4),属于动点h(tf),tf自由0]),([ffttx)(ftx这时,x(tf)=h(tf),有,因而,0)()(]),([ffffthtxttx)(*ft)(*fffttttHfTT(5)情况同(4),但tf固定此时不存在,因而横截条件(3-2-36)不存在,即tf不用确定。ft(6)情况同(1)~(4),但0]),([ffttx此时,只需在相应的横截条件方程中增加和项即可。ft)(ftx以上边界条件处理情况同样也适用于经典变分法求解最优控制问题。3.4极大值原理的典型应用之一——最短时间控制最短时间控制又称为快速控制或时间最优控制,其基本特征是在满足一定约束条件前提下,取一控制作用(最优控制),使系统以最短的时间从初始状态转移到给定的终态。的某个终态,并使性能指标(3-4-4)最小。其中,对x,t连续可微,tf未知。(1)最短时间控制问题提法已知系统状态方程(3-4-1

1 / 34
下载文档,编辑使用

©2015-2020 m.111doc.com 三一刀客.

备案号:赣ICP备18015867号-1 客服联系 QQ:2149211541

×
保存成功