航天器姿态稳定强化学习鲁棒最优控制方法

肖冰<sup>*</sup>; 张海朝

摘要

针对外部干扰力矩作用下的刚体航天器姿态稳定最优控制问题，提出了一种在线强化学习的智能鲁棒控制方法。该方法基于自适应动态规划框架，设计单Critic神经网络在线地学习无干扰作用的航天器的最优姿态控制律，并设计一种新的自适应律在线估计Critic神经网络的权值，实现了近似最优的控制性能。在学习的近似最优控制律的基础上，嵌入鲁棒控制量，形成鲁棒智能控制器，并应用Lyapunov理论证明了闭环姿态控制系统是一致最终有界稳定的，且Critic神经网络的权值估计误差是收敛的。相比于采用Actor-Critic神经网络结构的自适应动态规划方法，该方法一方面削弱了对持续激励条件的依赖，另一方面降低了计算复杂度，并保证了姿态稳定控制性能对外部干扰具有较强的鲁棒性。

单位
自动化学院; 西北工业大学

收藏分享被引浏览

更新时间：2024-01-12 07:16

航天器姿态稳定强化学习鲁棒最优控制方法

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友