摘要
人工智能技术的突破性进展为飞行器再入制导技术的研究提供了新的技术途径。无论是基于标称轨迹的制导还是预测校正制导,都需要基于人工经验设计飞行走廊参数。本文旨在突破传统制导方法中普遍存在的“锥形”飞行轨迹包络的约束,利用强化学习技术在智能决策方面的天然优势,在满足动力学方程和热流率、过载、动压等硬条件的前提下,通过飞行器与环境的大量交互“试错”:一方面,借鉴人类基于反馈来调整学习策略的思想,设置有效的奖励(反馈)引导;另一方面,利用强化学习中近端策略优化(PPO)算法训练飞行器倾侧角制导模型,基于实时的状态信息在线决策倾侧角指令,探索出完全不同于传统制导方法的“新质”飞行走廊。Monte Carlo仿真分析验证了基于强化学习的智能制导技术能够充分发挥飞行器的宽域飞行优势,进一步拓展飞行剖面。
-
单位中国运载火箭技术研究院