摘要

本发明提供的一种雷达智能认知抗干扰策略的生成方法,采用WR~2L鲁棒强化学习框架构建抗干扰策略生成网络,作为FA雷达的代理,该框架能够处理高维任务,并拥有较高的性能,在网络训练过程中,通过使用参数化的干扰策略和参数摄动后的网络参数设计抗干扰策略,对神经网络的部分权值进行优化摄动的干扰策略摄动方法,将奖励根据一个雷达相干处理时间CPI中FA雷达代理的检测概率计算得到,使得雷达能够在环境和测试之间存在不确定性的情况下保持较高的抗干扰能力,减少生成鲁棒抗干扰策略的计算量,与非鲁棒性抗干扰策略相比抗干扰能力得到了较大提升。