摘要
针对预先设定学习率的增量强化学习(IRL)飞行控制律失败率较高,并且无法适应飞行器大范围动力学特性变化下的稳定控制问题,提出一种自适应学习率的增量强化学习(ALRIRL)控制方法。首先,基于小波分析方法构造控制系统稳定度评价函数,用于评估控制器稳定度。然后,基于梯度下降法设计学习率在线迭代计算方法,以提升强化学习控制器的收敛性。最后,通过随机初始状态及随机动压变化下蒙特卡洛打靶试验和数学仿真来验证ALRIRL算法,仿真结果表明提出的方法能够根据参考状态跟踪误差振荡情况自适应调整学习率参数,实现飞行姿态稳定跟踪控制,提高强化学习飞行控制器的成功率。该方法减轻了IRL飞行控制算法对预先设定学习率超参数的依赖,拓宽了IRL在飞行器大范围动力学参数变化情况下的应用。
-
单位中国运载火箭技术研究院; 北京理工大学