摘要

为解决传统再入飞行器轨迹制导方法对强扰动条件适应性不足,难以满足终端约束的问题,本文在深度确定性策略梯度学习框架基础上,通过对随机强扰动条件下的离线飞行轨迹进行网络训练,寻找不同环境影响条件下的最优动作网络,以用于在线干扰条件下的制导轨迹规划,可通过对再入飞行攻角和倾侧角剖面的周期性预测,满足再入飞行终端高度、航程和速度约束。仿真实验结果表明:在满足终端高度约束的条件下,最大终端剩余航程偏差小于500m,最大终端速度偏差小于35m/s。本文所提制导方法较传统跟踪制导方法有较大的精度提升,算法计算量小,具有较好的工程应用前景。