摘要
针对传统雷达抗复合干扰决策难、时间长、难以预测的问题,提出了一种基于先验知识强化学习的雷达抗复合干扰的方法。该方法将雷达单一干扰效益,拓展到复合干扰效益,进一步得到复合干扰转化概率矩阵,通过强化学习得到动作价值矩阵,确定最优抗复合干扰策略。实验仿真发现:与传统的Q-learning相比,基于先验条件的雷达智能抗干扰决策更加贴近战场情况,可以较为准确地预测下接下来干扰状态,为指挥员提供决策依据。
-
单位中国人民解放军海军大连舰艇学院