基于强化学习的航天器姿态控制器设计

张瑞卿; 钟睿<sup>*</sup>; 徐毅

doi:10.19328/j.cnki.2096-8655.2023.01.010

摘要

航天器在轨执行某些任务时，其质量参数会发生未知变化，传统控制方法在这种情况下控制效果不佳。本文提出基于强化学习的航天器姿态控制器设计方法，该方法在姿态控制器训练过程中不需要对航天器进行动力学建模，不依赖航天器的质量参数。当质量参数发生较大未知变化时，训练好的控制器仍然可以保持较好的控制效果。仿真测试表明：使用基于强化学习方法训练的控制器确实具有良好的鲁棒性。此外，回报函数的设计会明显影响姿态控制器的训练，因此对不同的回报函数设计进行了研究。

单位
上海卫星工程研究所; 北京航空航天大学

全文

访问全文

收藏分享被引浏览

更新时间：2024-03-15 19:02

基于强化学习的航天器姿态控制器设计

摘要

全文

产品服务

站内浏览

服务支持

联系方式

科研之友