摘要
针对无人作战飞机在一对一自主空战中无法实现智能决策的问题,引入深度强化学习方法,构建无人战斗机战术决策框架,求解智能体对抗的机动指令。首先,建立飞行运动模型和导弹攻击区模型,形成基本的一对一空战对抗环境。其次,利用8个运动变量来构建智能体连续的状态空间,并根据导弹攻击区实时计算结果设计奖惩函数,实现双机对抗决策。最后,使用长短期记忆网络和全连接网络相结合,构建智能体价值网络和目标网络。利用记忆库中的决策样本,对网络进行训练,完成值函数的拟合,实现智能体在任意状态下的决策。仿真试验表明,在典型的案例中,智能体能够有效感知空战场态势,算法给出的决策动作可以积累并保持无人作战飞机的空战优势,完成对目标的打击,决策时间能够满足时效性的要求。
-
单位空军工程大学