零碎的知识点（七）：线性二次调节器（LQR）是什么？

线性二次调节器（LQR）是什么？

线性二次调节器（LQR） 是一种经典的最优控制方法，用于求解线性系统的状态反馈控制问题。其目标是在满足动态约束的前提下，通过设计状态反馈控制器，使系统的性能指标达到最优。

1. LQR的定义与目标

LQR主要解决以下问题：

系统的状态描述为线性动态系统：
$\dot{x}(t) = A x(t) + B u(t)$
其中：
- $\in \mathbb{R}^n$ 是系统状态向量；
- $\in \mathbb{R}^m$ 是控制输入；
- $\in \mathbb{R}^{n \times n}$ 是状态矩阵；
- $\in \mathbb{R}^{n \times m}$ 是控制矩阵。
设计一个控制律 $u (t) = - K x (t)$ ，其中 $K$ 是控制增益矩阵，使以下性能指标 $J$ 最小化：
$\int_{0}^{\infty} \left( x(t)^T Q x(t) + u(t)^T R u(t) \right) dt$
其中：
- $\in \mathbb{R}^{n \times n}$ 是对状态 $x (t)$ 的加权矩阵（正定或半正定）；
- $\in \mathbb{R}^{m \times m}$ 是对控制输入 $u (t)$ 的加权矩阵（正定）。

2. LQR的原理

性能指标 $J$

性能指标 $J$ 的物理意义是权衡系统偏离零状态（通过 $x(t)^T Q x(t)$ ）和控制能量消耗（通过 $u(t)^T R u(t)$ ）的代价。设计 $Q$ 和 $R$ 时：

较大的 $Q$ 强调减少状态偏离；
较大的 $R$ 强调控制能量的节省。

最优解的计算

LQR 的核心是通过Riccati方程计算最优状态反馈增益矩阵 $K$ 。具体步骤如下：

计算解 Riccati 方程的对称正定矩阵 $P$ ：
$A^T P + P A - P B R^{-1} B^T P + Q = 0$
这是一个连续时间代数 Riccati 方程（CARE）。
利用 $P$ 计算反馈增益矩阵：
$K = R^{-1} B^T P$

控制律

最优控制律为：
$u (t) = - K x (t)$

3. LQR的性质

稳定性：如果 $Q$ 和 $R$ 正定，LQR 控制器设计的闭环系统是渐进稳定的。
鲁棒性：LQR 对模型的参数扰动具有一定的鲁棒性，但仅限于小扰动。
灵活性：通过调整 $Q$ 和 $R$ ，可以改变状态和控制能量之间的权衡。

4. 举例说明

问题描述

一个简单的二阶质量-弹簧-阻尼系统：
$\ddot{x} + c \dot{x} + k x = F$
将其转换为状态空间形式：
$\begin{bmatrix} \dot{x}_1 \\ \dot{x}_2 \end{bmatrix} = \begin{bmatrix} 0 & 1 \\ -\frac{k}{m} & -\frac{c}{m} \end{bmatrix} \begin{bmatrix} x_1 \\ x_2 \end{bmatrix} + \begin{bmatrix} 0 \\ \frac{1}{m} \end{bmatrix} u$
其中：

$x_1 = x$ 是位移；
$x_2 = \dot{x}$ 是速度；
$u = F$ 是控制输入。

设参数为：

$m = 1$ kg；
$c = 0.5$ Ns/m；
$k = 2$ N/m；
$\text{diag}(1, 1)$ ；
$R = 0.1$ 。

解步骤

确定状态矩阵 $A$ 和控制矩阵 $B$ ：
$\begin{bmatrix} 0 & 1 \\ -2 & -0.5 \end{bmatrix}, \quad B = \begin{bmatrix} 0 \\ 1 \end{bmatrix}$
解 Riccati 方程，得到 $P$ ：
$\begin{bmatrix} 2.236 & 1.118 \\ 1.118 & 2.618 \end{bmatrix}$
计算最优增益矩阵 $K$ ：
$R^{-1} B^T P = \begin{bmatrix} 4.472 & 3.618 \end{bmatrix}$
最优控制律：
$\; 3.618] \begin{bmatrix} x_1 \\ x_2 \end{bmatrix}$

仿真结果

在闭环控制下，系统状态 $x (t)$ 会快速趋于零，同时控制输入 $u (t)$ 保持较小，体现了状态偏差和控制能量的优化。

5. 实际应用

航天器姿态控制：
LQR 用于最优设计航天器的姿态调节控制器，确保姿态调整时能量最低。
机器人控制：
在机器人路径跟踪中，LQR 用于控制机器人的位置和速度。
车辆动力学控制：
在自动驾驶系统中，LQR 常用于轨迹跟踪问题，设计车辆的方向和速度控制。

总结

LQR 是一种功能强大且理论完善的最优控制方法，通过解决 Riccati 方程和设计反馈增益矩阵，能够为线性系统提供稳定且高效的控制策略。它的应用遍及多个工程领域，是现代控制理论的重要组成部分。