摘要
本发明涉及一种基于深度Q网络的雷达干扰机博弈策略获取方法,包括:雷达作为深度强化学习代理选择雷达动作;干扰机作为深度强化学习代理选择干扰机动作;根据雷达动作和干扰机动作分别获取博弈过程的转移经验,转移经验包括:雷达转移经验和干扰机转移经验;根据雷达和干扰机各自对应的转移经验,基于监督学习拟合各自对应的历史最优行动策略;根据雷达和干扰机各自对应的转移经验和各自对应的历史最优行动策略训练各自对应的深度Q网络和监督网络参数;根据雷达和干扰机各自对应的监督学习模型获得各自对应的博弈策略。本发明可以准确地获得雷达干扰机博弈的纳什均衡策略。
- 单位