摘要
衡量航母作战性能的重要指标是舰载机出动架次率,而影响舰载机出动架次率的关键因素是舰载机保障作业调度效率.舰载机保障作业调度是指在有限时间、空间和资源约束的前提下合理安排舰载机所需保障作业顺序并高效完成舰载机的作业保障.现有基于最优化方法 (动态规划、线性规划等)和启发式方法 (如遗传算法、粒子群等)的求解策略仅适用于保障作业可预知情况下的作业调度,很难满足高动态作战场景下的实时保障作业调度需求.基于此,本文提出了一种新的基于DQN (deep Q-network)的舰载机保障作业实时调度方法,将舰载机保障作业调度问题建模成部分可观测马尔科夫决策过程(partially observable Markov decision processes)问题,利用全局与长期收益对保障作业调度过程进行优化,并通过离线学习和在线调配的学习决策框架进行解决.经过仿真实验验证,该方法能显著提高舰载机保障作业调度效率并满足实时决策环境的需要.