摘要
通过体系作战下的系统作战仿真平台,利用强化学习方法实时调整巡航导弹航迹,实现面对敌方传感器的动态隐身。以巡航导弹突防美军“海军综合防空火控”系统为典型作战场景,基于体系作战仿真平台设计了一种引入动态预警威胁和拦截脱靶量的奖励函数,使用深度确定性策略梯度算法训练巡航导弹突防模型,模型训练完成后巡航导弹通过感知预警机和拦截导弹的状态,改变其机动轨迹以降低探测概率和提高拦截脱靶量,达到动态隐身的效果,进而提升其战场生存能力和突防能力。
-
单位电子信息工程学院; 北京航空航天大学