Q-learning强化学习协同拦截制导律

作者:王金强; 苏日新; 刘莉; 刘玉祥; 龙永松
来源:导航定位与授时, 2022, 9(05): 84-90.
DOI:10.19306/j.cnki.2095-8110.2022.05.009

摘要

为实现多枚导弹协同拦截机动目标,提升拦截效能,提出了一种Q-learning强化学习协同拦截制导律。首先,基于逃逸域覆盖理论,建立了非线性多弹协同拦截模型。其次,以视线角速率为状态,依据脱靶量构造奖励函数,通过离线训练生成强化学习智能体,并结合传统比例制导控制方法,构建基于强化学习的变导引系数制导律,实时生成实现协同拦截的制导指令。最终,通过数值仿真验证了所提算法的有效性和优越性。

  • 单位
    江南机电设计研究所