基于多目标优化与强化学习的空战机动决策

作者:杜海文*; 崔明朗; 韩统; 魏政磊; 唐传林; 田野
来源:北京航空航天大学学报, 2018, 44(11): 2247-2256.
DOI:10.13700/j.bh.1001-5965.2018.0132

摘要

为了解决无人机自主空战中的机动决策问题,提出了一种将优化思想与机器学习相结合的机动决策模型。采用多目标优化方法作为决策模型核心,既解决了传统优化方法需要为多个优化目标设置权重的困难,又提高了决策模型的可拓展性;同时在多目标优化的基础上通过强化学习方法训练评价网络进行辅助决策,解决了决策模型在对抗时博弈性不足的缺点。为了测试决策模型的性能,以近距空战为背景,设计了3组仿真实验分别验证多目标优化方法的可行性、辅助决策网络的有效性以及决策模型的总体性能,仿真结果表明,决策模型可以对有机动的敌机进行有效的实时机动对抗。

  • 单位
    空军工程大学

全文