摘要

为有效求解多平台协同火力分配问题,本文根据“分而治之”的思想,基于任务分解策略将复杂的决策任务分解为子目标平台选择和子平台火力分配两个阶段,通过融合启发式算法与强化学习模型,提出了一种新的强化学习求解方法 HARL,并以多平台联合火力打击为作战背景进行了实验仿真。子目标平台选择层根据当前状态,基于强化学习策略选择攻击当前子目标最适合的火力平台,而子平台火力分配层则使用启发式算法为执行攻击任务的平台规划最优的火力分配方案。实验结果表明,融合了启发式算法和强化学习的HARL方法相比于传统的强化学习算法武器消耗量减少15%以上,相比于经典的启发式算法求解时效性提升20%以上,证明了该研究成果可为未来求解复杂作战决策问题提供有力的技术支持。

全文