摘要

针对执行机构部分失效的速度时变导弹机动目标拦截问题,本文提出一种基于深度强化元学习和剩余飞行时间感知逻辑函数的攻击角度约束三维制导律。首先,采用基于模型的深度强化元学习方法,建立深度神经网络动力学模型;引入模型预测路径积分控制,该深度神经网络动力学模型作为预测模型;采用元学习方法,在线学习执行机构部分失效及目标机动等环境变化。其次,提出基于偏态分布的采样方法,提升模型预测路径积分控制的采样效率。再次,在制导律的指标函数设计中提出一种逻辑函数,降低了制导初始阶段的加速度,提升了末速度。最后,多种情况下的仿真结果及蒙特卡洛仿真校验了方法在提升采样效率与降低初始阶段加速度的有效性。