第六章最优控制……..(侯媛彬)关键点:
1变分法和最优控制概念
2 最大值原理
3 线性最优控制器设计
难点:
线性最优控制器设计
§6-1变分法和最优控制
一、基础概念
1.泛函
为
J?J [ x ( t )]
或简记为J。依据函数定义,泛函可了解为“函数函数”,即泛函值是由函数选择而定。比如,
J | ? | 1?0 | x | ( dt | x | (t | ) | 选择而定。其中函数 | x | (t | ) | ||||||
是一个泛函, 因为 | J | 值是由函数 | |||||||||||||||
称为泛函 | J | [ | x | ( t | )] | 宗量。 | |||||||||||
2.泛函变分
在泛函极值问题中,泛函变分是处理问题一个关键方法,
下面讨论泛函变分及相关概念。
(1)宗量变分
?x | ( t | ) | 泛函 | J | [ | x | ( t | )] | 宗量 | x | (t | ) | 变分, 是指两个函数间差, 记作 | |||||||
? | x | ( t | ) | |||||||||||||||||
? | x | 0t | ) | |||||||||||||||||
(2)泛函连续性
若对于函数 | x | (t | ) | 微小改变, 泛函 | J | [ | x | ( t | )] | 变换也很微小, | |||
那么就说泛函 | J | [ | x | ( t | )] | ||||||||
是连续。 | |||||||||||||
(3)宗量函数相近度
当函数 | x | (t | ) | 和 | x | 0t | ) | 之差绝对值, 即 | |||||||||||||||
对于函数 | x | (t | ) | x | ( t | )?x 0t ) | (6-1) | 和 | |||||||||||||||
x | (t | ) | |||||||||||||||||||||
| |||||||||||||||||||||||
同时很小时, 就说函数 | x | (t | ) | 和 | x | 0t | ) | 是相差微小或相近。 | |||||||||||||||
为了区分上面两种情况,把满足式(6-1)两个函数称为含有零阶相近度,满足式(6-2)两个函数称为含有一阶相近度,含有一阶相近度函数肯定含有零阶相近度,反之,则不一定。依据一阶相近度概念,很轻易推广,即当
x | ( t | ) | ? | x | 0 | ( t | ) | , | x | ( t | ) | ? | x | 0 | ( t | ) | , | ? | , | x | ( | k | ) | ( t | ) | ? | x | ( | k | ) | ( t | ) | (6-3) |
0 |
均很小时, 称函数含有K 阶相近度。 (4)空间距离
定义在区间 | [ | a | , | b | ] | 上连续函数全体是一个函数空间, | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
记为 | C | [ | a | , | b | ] | , 其中对应 | a | ? | t | ? | b | 每个函数 | x | (t | ) | 全部是这个空间 | |||||||||||||||||||||||||||||||||||||||||||||||||
一点, 定义 | C [ | a | , | b | ] | 中两点距离为 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
d | ( | x | , | x | 0 | ) | ? | a | max | b | x | ( t | ) | ? | x | 0 | ( t | ) | (6-4) | |||||||||||||||||||||||||||||||||||||||||||||||
若定义 | [ | a | , | b | ] | 上连续且含有连续K 阶导函数函数全体是一个 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
空间, 记为 | Ck | [ | a | , | b | ] | , 定义 | Ck | [ | a | , | b | ] | 中两点距离为 | ||||||||||||||||||||||||||||||||||||||||||||||||||||
d | ( | x | , | x | 0 | ) | ? | a | max | b?x | ( t | ) | ? | x | 0 | ( t | ) | , | x | ( t | ) | ? | x | 0 | ( t | ) | , | ? | x | ( | k | ) | ( t | ) | ? | x | ( | k | ) | ( t | ) | ? | ||||||||||||||||||||||||
0 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
(6-5)
显然,由式(6-4)和式(6-5)定义距离可用来定量
刻划两个函数零阶和K 阶相近度。 |
(5)泛函变分
假如连续泛函 | J | [ | x | ( t | )] | 增量表示式为 | (6-6) | |||||||||||||
?J | [ | x | ] | ? | J | [ | x | ? | ?x | ] | ? | J | [ | x | ] | |||||
应用泰勒公式将(6-6)在x点展开,得
| ?J | [ | x | ] | ? | dJ | [( | x | ? | ?x | ) | ? | x | ] | ? | 1 | d | 2 | J | [( | x | ? | ?x | ) | ? | x | ] | 2 | ? | ? | |
| | | | | | dx | | | | 2 ! | dx | 2 | | | | | | x | ] | | ? | | |||||||||
(6-7) | |||||||||||||||||||||||||||||||
? | dJ | ?x | ? | 1 | d | 2 | J | ? | x | ) | 2 | ? | ? | ||||||||||||||||||
| |||||||||||||||||||||||||||||||
当 | ?x | | dx | 2 ! | dx | 2 | | |
| | | ||||||||||||||||||||
很小时, 式(6-7)右边是相关 | ?x | 线性连续泛函, 而 | |||||||||||||||||||||||||||||
其它均为 | ?x | 高阶无穷小。若用 | ?x | 线性连续泛函和 | ?x | 高阶 |
无穷小之和表示泛函增量,即有
?J | [ | x | ] | ? | L [ | x | ,?x | ] | ? | r [ | x | ,?x | ] | (6-8) |
那么,就把第一项称为泛函变分,记为
?J | ? | L [ | x | ,?x | ] |
当一泛函含有变分时,也称泛函是可微。泛函变分还能够写成另一个形式,即
?J | ? | ? | J | [ | x | ? | ??x | ] | | | (6-9) |
| | ?? | | | | | | | ?? | 0 | |
(6)泛函极值
若泛函 | J | [ | x | ( t | )] | 在 | x ?x 0t )邻域内, 即 | (6-10) | ||||||||||||||||||||||||||||||||||
x 0t )处有极大值或极小值。 | ||||||||||||||||||||||||||||||||||||||||||
当距离 | d | 定义为 | d | ( | x | , | x | 0 | ) | ? | a | max | b { | x | ( t | ) | ? | x | 0 | ( t | ) | , | x | ( t | ) | ? | x | 0 | ( t | ) | , | |||||||||||
泛函 | J | [ | x | ( t | )] | 在点 | x ? | x | 0t | ) | 处达成极值, 称为弱极值。 | |||||||||||||||||||||||||||||||
含有强极值泛函必有弱极值,反之不然。 (7)泛函极值存在条件
在点 | 泛函 | J | [ | x | ( t | )] | 在点 | x ? | x | 0t | ) | 处达成极值必需条件是泛函 | ||||
x ? | x | 0t | ) | 变分为零, 即 | (6-11) | |||||||||||
?J | ? | L [ | x | ,?x | ] | x | ?x 0? | 0 | ||||||||
二、欧拉方程
有了§6-1 概念, 能够深入讨论怎样确定函数 | x | (t | ) | , 使泛函 | Jx | (t | ) | 达 |
成极值问题。处理这一问题必需依靠一个关键关系式,这一关系式
称欧拉方程。
在最优控制系统中,其性能指标就是泛函J,所以用变分求解泛
函极值问题,也就是求解最优控制过程。因为控制多样性,其变分
问题也各不相同,现分别讨论。
1、 点固定情况
设泛函为
J??t 0 F ( (6-12) t1
泛函J达成极值最优函数。设x(t)是x*t )邻域内一个函数,它和x*t )
满足下列关系
式中, | ? | x | ( t | ) | ? | x | * | ( t | ) | ? | ?? | t | ) | (6-14) | ||
x | ( t | ) | ? | x | * | ( t | ) | ? | ?? | t | ||||||
?是一个数值很小参数, | ?(t | ) | 是任一有连续导数且满足条件 | |||||||||||||
?( t | 0 | ) | ? | ? | t 1 | ) | ? | 0 | ||||||||
函数。这么端点固定条件得到了确保,即
x | * | ( t | 0 | ) | ? | x | ( t | 0 | ) | ? | x | 0 | ? | ? | 0 | , 恒有 |
| ||
x | * | ( t 1 | ) | ? | x | ( t 1 | ) | ? | x 1 | ||||||||||
显然, 不管函数?(t | ) | 怎样选, 当初 | |||||||||||||||||
| |||||||||||||||||||
x | * | ( t | ) | ? | x | ( t | ) |
即取得了最优函数。
现将式(6-13)代入式(6-11),得
J | (?) | ? | t 1?t 0 | F | ( t | , | x | * | ? | ?? | x | * | ? | ?? | dt | (6-15) | ||||||||||||
比较式(6-12)和(6-15)。当式(6-12)在 | x ? | x | * t | ) | 时达成极值, | |||||||||||||||||||||||
相当于式(6-15)在 | ? | ? | 0 | 时取极值。应用式(6-11), 要使 | J | (?) | 取 | |||||||||||||||||||||
极值, 必有 | ?J | (?) | ? | ( | dJ | (?) | ) | ??? | ? | 0 | ||||||||||||||||||
| d? | |||||||||||||||||||||||||||
要使上式在任何时均成立,只有
dJ | (?) | | ? | 0 | (6-16) | ||||||||
d? | ?? | 0 | | | |||||||||
所以, 在用式(5-16), 即可使J (?)取极值。 | |||||||||||||
(注: 设 | F | ( t | , | x | , | x | ) | 含有二阶连续偏导数, 故求导和积分可交换次 | |||||
序。) | |||||||||||||||||||||
t 1 | F x?dt | ? | F x?t t 0 | ? | t 1 d?t 0 ? dt | F x | ? | ? | t 1 d?t 0 ? dt | F x | |||||||||||
则 | dJ | (?) | ?? | | t 1 | Fx | ? | d | F x | ) | dt | ? | 0 | | |||||||
d? | 0 | | dt | ||||||||||||||||||
依据拉格朗日定理: 若连续函数 | M | (t | ) | , 对于任意?(ta | , | b | ] | 满 | |||||||||||||
足 | [ | a | , | b | b?a | M | ( t | )? | t | ) | dt | ? | 0 | 0 | , 所以有 | ||
则在 | ] | 一定有 | M | ( t | ) | ? | |||||||||||
Fx | ? | d | F x | ? | 0 | (6-17) |
| | dt | | | | |
将方程展开,得
Fx?Fx t?xF x x??x?Fx x?0 (6-18)
式(6-17)或(6-18)常常称为欧拉方程。所以,函数x(t)满足欧拉
t1
方程使式(6-12)即J??t0F(t,x,x)dt泛函取极值必需条件。
三、含有多个未知函数泛函
函可记为
t1
J[x]??t0 F(t,x,x)dt (6-19)
其中,F是数量函数, x是维向量函数。
?x1?
x?
?
?x2?
?
???
??
?xn?
采取和数量函数情况相同推论方法,可得向量形式欧拉方程,
?F | ? | d | ?F | ? | 0 | (6-20) | ||
?x | dt | ?x | | | | |||
上式中数量函数 | F | 对向量函数得导数, 定义为 | ||||||
| | ? | ?F | ? | | |
?F | | ??? | ?x 1 ?F | ? | | |
| ? | ? | ?x 2 ? ?F | | | |
?x | | ???? | ? | | ||
| | ?? | ?x | n | ?? | |
设端点A是固定得,端点B可沿曲线
x | ( t 1 | ) | ? | ? | ( t 1 | ) |
变动,此时B点得横截条件为
[ | F | ? | ( | ??? | ? | x? | ) | ?F | ] | ? | 0 | (6-22) |
| | | | | |
| ?x | | t 1 | | | |
四、条件极值变分 |
| |||||||||||
问题。处理这类变分通常采取所谓拉哥郎日乘子法, 即结构一个常 | ||||||||||||
有乘子辅助函数
式中 | ?i | H | ? | F | ? | m i?1 | ?if | i | f | i | (6-23) |
是乘子, 它通常是时间函数; | 是泛函变量需满足第个约 | ||||||||||
束方程。则泛函为
J | 0 | ? | t 1 | (6-24) |
这么就得到了一个无条件泛函。下面分两种约束形式进
行讨论。
1.几何约束
现有泛函
J | ? | t 1?t 0 | F | ( t | , | x 1 | , | ? | , | x | n | , | x 1 | , | ? | , | x | n | ) | dt |
求它在几何约束条件
f | i ( t | , | x 1 | , | ? | x | k | , | ? | x | n | ) | ? | 0 | i | ? | 1 , | 2 , | ? | n | , | m | |
( | m | ? | ) | ||||||||||||||||||||
下极值。
设 | n | ? | 2 , | m | ? | 1 | , 应用乘子结构函数为 |
简记H ( t , x 1 , x 2 , x 1 , x 2 )) (6-26) t 1 | |||||||||||||||
然后, 求泛函 | J | 0 | 无条件极值, 写出欧拉方程 | ||||||||||||
? | Hx 1 | ? | d | H x 1 | ? | 0 | (6-27) | ||||||||
dt d | ? | | |||||||||||||
? | ? | 0 | |||||||||||||
Hx | 2 | H x | | ||||||||||||
dt | | 2 | | | |||||||||||
将约束方程和欧拉方程联立求解, 即可求得 | x 1, x | 2 | 和 | ?3 个未知函 | |||||||||||
数。利用端点边界条件可确定欧拉方程中积分后4个任意常数。
2.运动约束
当约束方程中含有函数导数项时,我们称此时得约束条件为运
动约束, 其通常表示式为
f | ( t | , | x 1 | , | ? | , | x | n | , | x 1 | , | ? | , | x | n | ) | ? | 0 |
|
在这种约束条件下求泛函极值方法,和求几何约束泛函极值方
法完全一致。
§6-2最大值原理
最大值原理是又一个求解最优控制问题方法。它是庞特里雅金
等人提出。这种方法是古典变分学延伸,但能成功古典变分法不易
处理问题。
定理: 设U(t)是一个许可控制, x(t)是对应于U(t)轨线, P(t)是
对应于U (t )和x(t )得共态变量, 则为最优控制U*和最优轨
线
在点u?U*t )处达最大值。此定理就是“最大值原理”。
[例6-1]有以下二阶系统
且 | u | ( t | ) | ? | x 1 | ? | ? | x | ? | u | ? | x 1 | ( | 0 ) | ? | 1 | 使系统在终态自由情况下使泛 | ||||||||
x | 2 | ? | x 1 | x | 2 | ( | 0 ) | ? | 0 | ||||||||||||||||
1 | , 试求出最优控制 | U | * t | ) | |||||||||||||||||||||
函 | J | ? | x | 2 | |||||||||||||||||||||
( t | 1 | ) | t 1 | ?1 | 取极值。 | ||||||||||||||||||||
解: 先结构H函数
H | ? | P 1 | ( | ? | x 1 | ? | u | ) | ? | P 2 | x 1 | J | ??C i x i ( t )可知, 本 |
据通常形式最优控制问题中泛函形式 | |||||||||||||
例中 | C 1 | ? | 0 , | C | 2 | ? | 1 |
依据哈密顿正则方程,得
| |
| | | ????? | P? 1 | ? | ? | ?H | ? | P | ? | P | |
| | | | | | | | | ||||||||
| |
| | | ?x 1 ?H | 2 | 1 | |
| | | | | | | | | ||||||||||||||
? | ? | ? | |||||||||||||||||||||||||||||
P? | 0 | ||||||||||||||||||||||||||||||
又依据 | X? | i | ? | f | ?? | 2 | | ?x | 2 | | | 0 | ) | ? | X | i | 0 | i | ? | 1 , | ? | , | n | 终点条件, 即 | |||||||
i | ( | x | , | u | , | t | ), | X | i | ( t | |||||||||||||||||||||
P i | ( t | i | ) | ? | ?C i |
| 有 | ||||||||||||||||||||||||||
P 1 | ( t 1 | ) | ? | P 1 | ( 1 ) | ? | ?C 1 | ? | 0 | ||||||||||||||||||||||||
P 2 ( t 1 )?P 2 ( 1 )??C 2??1 | |||||||||||||||||||||||||||||||||
P 2 | ( t | ) | ? | C | |||||||||||||||||||||||||||||
代入终点条件,得 | P 2 | ( t | ) | ? | ?1 | 即 | |||||||||||||||||||||||||||
P 2 | ( t | ) | ? | ?1 | C | ? | ?1 | ( | c | ) | |||||||||||||||||||||||
将 | (c | ) | 式代入 | (a | ) | , 有 | |||||||||||||||||||||||||||
P? 1 | ?P 1 | ? | 1 | ||||||||||||||||||||||||||||||
解方程 | dP 1 | ?P | 1 | ? | 1 | ||||||||||||||||||||||||||||
dt | |||||||||||||||||||||||||||||||||
则通解为 | P 1 | ?? | ? | 1 dt ? | P 1 |
| |||||||||||||||||||||||||||
代入终点条件, | C | ? | ?1 | , 有 |
| ||||||||||||||||||||||||||||
P 1 | ( t | ) | ? | ? | t?1 | ? | 1 | ( | d | ) | u | ? | 1 | 约束条件下达成 | ||
现利用最大值原理, 为了使变量函数H 在 | ||||||||||||||||
最大值, 即 | H | ? | P 1 | u | 达最大值, | |||||||||||
只有取
u(t)?
?
?
?
?
?1
1
,
,
P
P1
2
(
(
t
t
)
)
?
?
0
0
又因为在区间[0 , 1 ]内,由(d)式可见P1(t)?0,所以应取
u(t)??1
在P1(t)?0时,u(t)没有定义。
故将u(t)??1和初始条件代入系统方程,可得最优轨线方程为
x*
x ( t )??2??t?
x 1 * ( t )?2??t?1
*应该注意得一点是,最大值原理仅是泛函取最小值得必需条
件,并不充足,所以求得解是否为极小值还要进行验证。易证实,
本例中 | u | * | ( t | ) | ? | ?1 | 确使 | J ? | x | 2 | ( 1 ) | 达成了极小值。 |
§6-3线性最优控制系统
一、二次型性能指标得最优控制问题 当性能指标泛函含有形为
J | ? | 1 | x? | ( t | ) | Sx | ( t | ) | ? | 1 | t 1 |
| x?Qx | ? | U | ?RU | ] dt | (6-28) | ||||
| | 2 | | 1 | | | 1 | | | 2 | ?t 0 |
| | | | |||||||
时候称为二次型性能指标。其中和 | Q | 是半正定对称矩阵, | R | 是正 | ||||||||||||||||||
定对称矩阵。上式中第一项中系数 | 1 | 是为了简化计算。 | ||||||||||||||||||||
2 | ||||||||||||||||||||||
下面是相关有限时间调整器问题。
设n阶系统
? | x | ? | A ( t | ) | x | ( t | ) | ? | B | ( t | ) u | ( t | ) | (6-29) | ||
x | ( t | 0) | ? | x | 0 | |||||||||||
现在需要确定使性能指标
J | ? | 1 | t 1 | [ | x?Qx | ? | U | ?RU | ] dt | (6-30) |
| | 2 | ?t 0 |
| | | | | | |
取极小值得最优控制U
?Y??YA?A?Y?Y (6-31)其中是固定,终态1 x ( 1
上式为能够成状态反馈闭环系统最优控制表示式。
现在把二次型性能指标调整器问题求解过程写成以下定理
定理: 若给定线性系统
? | x | ? | A ( t | ) | x | ( t | ) | ? | B | ( t | ) u | ( t | ) | ||||||||||
x | ( t | 0) | ? | x | 0 | ||||||||||||||||||
其中控制u 没有约束, | A (t | ) | 和 | B | (t | ) | 是连续, 且性能指标泛函为 | ||||||||||||||||
| | J | ? | 1 | t 1?t 0 | [ | x?Qx | ? | U | ?RU | ] dt | | (6-33) | ||||||||||
其中 | Q | 2 | | R | 是连续、正定、对称矩 | ||||||||||||||||||
是连续、半正定、对称矩阵, | |||||||||||||||||||||||
阵,则使泛函J取最小值最优控制为
U | * | ( t | ) | ? | ? | R | ?1 | B? | ( t | ) Y | ( t | ) | x | ( t | ) | (6-34) |
而最优控制性能指标函数为
其中, 矩阵 | | V | * | [ | x | ( t | ), | t | ] | ? | 1 | x? | ( t | ) Y | ( t | ) | x | ( t | ) | | | | | (6-35) | |||
Y | | |
| | 2 | | | | | | | Y | ( 1 ? | 0 | 解。 | | |||||||||||
(t | ) | 是矩阵里卡拉方程 | |||||||||||||||||||||||||
? | Y? | ? | YA | ? | A?Y | ? | YBR | ?1 | B?Y | ? | Q | 满足终点条件 | |||||||||||||||
两点说明:
① 若把(6-33)式右边 | 1 | 舍去, 则只对应地把(6-35)右边 | 1 | 舍 |
| 2 | | 2 | |
去即可;
② 若泛函J 取更通常形式 | (6-36) |
现在举例说明定理应用。 | |
[例6-2] 已知系统
x | ? | ? | x | ? | u | , | x |
| 0 ) | ? | | |
| | | 2 | | | | |
| | | | 0 |
和性能指标函数
J | ? | 1 | Sx | 2 | ( t 1 | ) | ? | 1 | t 1?t 0 | [ | 2 | x | 2 | ? | U | 2 | ] dt | 。 | | | | |||||||||||
| 2 | | 2 |
| ? | 1 | | |||||||||||||||||||||||||
求最优控制 | U | * | 和最优性能指标 | V | * | |||||||||||||||||||||||||||
解: 由题意知, | A | ? | ? | 1 | , | B | ? | 1 , | Q | ? | 2 , | R | ||||||||||||||||||||
2 | | | | | | |||||||||||||||||||||||||||
则里卡拉方程为 | ||||||||||||||||||||||||||||||||
y | ? | y | ? | y | 2 | ? | 2 , | y | ( t 1 | ) | ? | s | ||||||||||||||||||||
| ||||||||||||||||||||||||||||||||
用分离变量法求解方程
| | dy | | | ? | dt | |
y | 2 | ? | y | ? | 2 | | |
分母配方后,两边积分得,
y | ? | ? | 1 | ? | 3 | th | ( | ? | 3 | t | ? | c | ) |
| | | 2 | | 2 | | | | 2 | | | | |
其中积分常数决定于终点条件
若设 | s | ? | y | ( 1 | ) | ? | s | C | ? | 1 . 845 | ||
1 | , 则可解出 | |||||||||||
0 , | t 1? | |||||||||||
最优控制为
U | * | ( t | ) | ? | [ | 0 . 5 | ? | 1 . 5 th | ( | ?1 . 5 t | ? | 1 . 845 )] | x | ( t | ) |
V * [ x ( t ), t ]?1 | |||||||||||||||