数值法求解最优控制问题(〇)——定义

基本描述

本篇文章给出最优控制问题的完整描述。

最优控制问题可简述为:对于一个受控系统,在满足约束条件下,寻求最优的控制量使性能指标最小。

数学描述为:寻找控制变量 $\boldsymbol{u}(t) \in \mathbb{R}^m$,使得性能指标

\[J = \Phi (\mathbf{x}(t_0),t_0,\mathbf{x}(t_f),t_f) + \int_{t_0}^{t_f} L(\mathbf{x}(t),\mathbf{u}(t),d) \text{d}t\]

最小。

状态变量和控制变量满足如下约束:

\[\begin{matrix} &\boldsymbol{\dot x}(t) = \boldsymbol{f}(\boldsymbol{x}(t),\boldsymbol{u}(t),t) \quad t \in [t_0,t_f], \\ &\phi (\boldsymbol{x}(t_0),t_0,\boldsymbol{x}(t_f),t_f)=0, \\ &\mathbf{C}(\mathbf{x}(t),\mathbf{u}(t),t) \le 0. \end{matrix}\]

式中,$\boldsymbol{x}(t) \in \mathbb{R}^n$ 为状态变量,$\boldsymbol{u}(t) \in \mathbb{R}^m$ 为控制变量,$t_0$ 为初始时间,$t_f$ 为终端时间。

状态变量的边界条件满足:

\[\boldsymbol{x} \in X \subset \mathbb{R}^n, \quad X = \left \{x \in \mathbb{R}^n: x_{lower} \le x \le x_{upper} \right \}\]

$x_{lower}$ 为状态变量下界,$x_{upper}$ 为状态变量上界。

控制变量的边界条件满足:

\[\boldsymbol{u} \in U \subset \mathbb{R}^m, \quad U = \left \{u \in \mathbb{R}^m: u_{lower} \le u \le u_{upper} \right \}\]

$u_{lower}$ 为控制变量下界,$u_{upper}$ 为控制变量上界。

上式 $\mathit{\Phi}, L, \boldsymbol{f}, \phi, \boldsymbol{C}$ 定义为:

\[\begin{aligned} &\mathit{\Phi}: \ \mathbb{R}^n \times \mathbb{R} \times \mathbb{R}^n \times \mathbb{R} \rightarrow \mathbb{R}, \\ &L: \ \mathbb{R}^n \times \mathbb{R}^m \times \mathbb{R} \rightarrow \mathbb{R}, \\ &\boldsymbol{f}: \ \mathbb{R}^n \times \mathbb{R}^m \times \mathbb{R} \rightarrow \mathbb{R}^n, \\ &\phi: \ \mathbb{R}^n \times \mathbb{R} \times \mathbb{R}^n \times \mathbb{R} \rightarrow \mathbb{R}^q, \\ &\boldsymbol{C}: \ \mathbb{R}^n \times \mathbb{R}^m \times \mathbb{R} \rightarrow \mathbb{R}^c, \\ \end{aligned}\]

最优控制中,控制量是时序变化的,其求解结果是若干条曲线。控制曲线确定后,状态曲线可依据微分动力学系统确定。

组成部分

上述最优控制问题一般由四部分组成,分别为:

  • 性能指标;
  • 控制系统微分方程约束;
  • 边界约束;
  • 路径约束。

性能指标

性能指标即优化问题中的目标函数,不过在最优控制领域我们叫它为性能指标。性能指标是衡量控制系统优劣的重要标志,一般有三种形式,分别是:

  • Mayer型性能指标;
  • Lagrange型性能指标;
  • Bolza型性能指标。

Mayer型性能指标

又称常值型性能指标,仅考虑控制系统在终端时间点各状态变量、控制变量、时间及其复合关系的指标,如飞行器运动至指定位置所消耗时间(即终端时间)等。数学描述为:

\[J = \Phi (\mathbf{x}(t_0),t_0,\mathbf{x}(t_f),t_f).\]

Lagrange型性能指标

又称积分型性能指标,仅强调对整个控制过程的要求,该指标包含对整个时间域内状态变量、控制变量及其复合关系的积分,可表示系统的能量消耗,如控制过程中造成的热量消耗大小等。数学描述为:

\[J = \int_{t_0}^{t_f} L(\mathbf{x}(t),\mathbf{u}(t),d) \text{d}t.\]

Bolza型性能指标

又称复合型性能指标,是Mayer型和Lagrange型的组合,不仅强调终端时刻的系统状态,还强调对控制系统过程的要求。该形式在一定条件下可转化为上述两种形式,所以描述一般最优控制问题性能指标时采用Bolza型性能指标。数学描述为:

\[J = \Phi (\mathbf{x}(t_0),t_0,\mathbf{x}(t_f),t_f) + \int_{t_0}^{t_f} L(\mathbf{x}(t),\mathbf{u}(t),d) \text{d}t.\]

控制系统微分方程约束

优化问题包含多种约束,最优控制问题也是一种特殊的优化问题,它的特殊之处在于约束条件有微分方程存在。

任何控制系统都需要使用微分方程组描述运动过程,例如飞行器受引力和推力作用,结合自身质量变化等特性,建立可描述其运动规律的动力学微分方程;机器人的机械手受力矩作用,结合自身手臂长度、质量、关节等特性,建立可描述其运动规律的动力学微分方程。上述方程可用微分代数方程(Differential Algebraic Equation,DAE)描述,为:

\[\boldsymbol{\dot x}(t) = \boldsymbol{f}(\boldsymbol{x}(t),\boldsymbol{u}(t),t) \quad t \in [t_0,t_f].\]

边界约束

控制系统中常常需要给定初始状态或末端状态,如火箭刚发射时的高度、速度等条件(即初始状态),在末端时刻需要指定火箭的高度、速度等条件(即末端状态)。在最优控制问题中,将上述处于某种特定时刻点处的状态称为边界约束。数学描述为:

\[\phi (\mathbf{x}(t_0),t_0,\mathbf{x}(t_f),t_f) = 0.\]

路径约束

控制系统在整个时间区段中必须满足的约束条件被称为路径约束。

路径约束和边界约束的区别是,路径约束发生在整个时间区段中,边界约束发生在特定时刻点上。

常见的路径约束包括:

  • 状态变量在整个控制过程的上、下限,如飞行器位置、速度等;
  • 控制变量在整个控制过程的上、下限,如电机的输出功率、力矩等;
  • 状态变量和控制变量组合而成的函数上、下限,如飞行器或机械手需要确保不能经过某些特定区域。

路径约束的数学描述为:

\[\mathbf{C}(\mathbf{x}(t),\mathbf{u}(t),t) \le 0.\]

总结

至此,便以给出性能指标、控制系统微分方程约束、边界约束和路径约束的数学描述。上述四部分完整定义了最优控制问题。

求解最优控制问题,也就是求解在满足上述三大类约束条件下使性能指标最小的优化问题。