基于课程强化学习的联合海空博弈决策模型训练方法

林泽阳; 赖俊<sup>*</sup>; 陈希亮; 王军

摘要

针对多智能体深度强化学习在解决联合海空作战战术博弈决策模型难以训练优化问题，结合多智能体深度强化学习在智能化指挥决策问题中的应用性优势，以及课程学习在复杂问题研究中的改进优势，构建基于马尔可夫决策过程的联合海空战术决策过程模型，提出基于复杂度指数函数的任务复杂性度量方法，建立基于值分解网络算法的求解模型。针对一个典型联合海空作战战术决策场景，构建从易到难的课程学习任务和模型求解框架，设计针对任务的决策模型训练方法，在兵棋推演仿真系统上，对模型训练方法的可行性进行了验证。

单位
中国人民解放军陆军工程大学

收藏分享被引浏览

更新时间：2024-03-15 15:56

基于课程强化学习的联合海空博弈决策模型训练方法

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友