摘要
多功能雷达是现代电磁战场上不可或缺的重要装备,针对多功能雷达的干扰一直是一个难题。本文在研究多功能雷达信号特点和雷达对抗过程的基础上,提出了雷达状态联合表征的方法,将多功能雷达的干扰决策问题建模为一个带收益的马尔可夫决策过程,设计了认知干扰决策系统,并通过基于Q-Learning的认知干扰决策算法求解该模型下的最佳干扰策略。通过仿真实验,证明了基于Q-Learning的认知干扰决策算法能够在缺乏先验经验的情况下学习到最佳干扰策略,具备“认知”的特性,并且在不稳定的环境中也具有较强的适应性,有效支撑了本文所提的干扰决策模型。
-
单位中国人民解放军装备学院