融合多属性决策和深度Q值网络的反导火力分配方法

谢俊伟; 方峰<sup>*</sup>; 彭冬亮; 任金磊; 王昌平

摘要

针对中大规模武器-目标分配(WTA)决策空间复杂度高、求解效率低的问题，该文提出一种基于多属性决策和深度Q网络(DQN)的WTA优化方法。建立基于层次分析法(AHP)的导弹威胁评估模型，引入熵值法表征目标属性差异，提升威胁评估客观性。根据最大毁伤概率准则，建立基于DQN的WTA分段决策模型，引入经验池均匀采样策略，确保各类目标分配经验的等概率抽取；设计综合局部和全局收益的奖励函数，兼顾DQN火力分配模型的训练效率和决策准确性。仿真结果表明，相较于传统启发式方法，该方法具备在线快速求解大规模WTA问题的优势，且对于WTA场景要素变化具有较好的鲁棒性。

单位
中国运载火箭技术研究院; 杭州电子科技大学; 自动化学院

收藏分享被引浏览

更新时间：2024-03-20 13:25

融合多属性决策和深度Q值网络的反导火力分配方法

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友