摘要
本发明涉及一种基于知识与有模型强化学习的雷达抗干扰策略学习方法,包括:S1、使雷达与已知多种干扰策略的第一干扰机对抗,构建先验信息库;S2、使雷达依据当前策略选择动作与未知干扰策略的第二干扰机进行交互,得到第二交互信息;S3、更新学习模型的参数;S4、将未知干扰策略分解为先验信息库中已知干扰策略的加权求和,构建得到雷达决策的目标函数;S5、评估模型近似损失;S6、利用模型近似损失评估未知干扰策略与已知干扰策略之间的相似程度,计算得到权系数;S7、利用权系数和目标函数计算雷达抗干扰策略并进行更新;S8、循环步骤S2-S7直至雷达性能收敛或者满足预设要求,获得最优雷达抗干扰策略。该方法提高了雷达学习抗干扰策略的效率。
- 单位