摘要
针对海上要地群协同防空作战动态火力分配问题,综合分析海上要地防空作战过程的特点,建立基于马尔可夫决策模型的动态火力分配问题,构建以海上要地毁伤期望、拦截成本为指标的优化模型。考虑到马尔可夫决策模型求解易陷入维数灾难的问题,提出利用近似动态规划方法来探究解的有效性,并给出基于强化学习的最小二乘时序差分算法来求解该问题。通过4种典型的攻防场景共80个案例仿真结果表明,相比传统的匹配算法、遗传算法和粒子群优化算法,新构建的模型和算法更加科学合理有效,可为海上要地群协同防空作战火力分配提供一定的理论依据。