摘要
针对非合作博弈模型不能准确描述战场环境下多智能体间的协作对抗关系,详细阐述博弈模型之间的关系,对比合作博弈模型与非合作博弈模型间的异同研究战场环境下多智能体间的博弈关系,将多智能体协作对抗问题建模为合作博弈模型并通过强化学习方法进行求解,最后并在多粒子仿真环境下用动态追逃任务对多智能体协同对抗任务进行仿真实验。结果表明:与非合作博弈算法相比,该合作博弈算法的收敛速度较快、收敛水平较高,且智能体间具有更强的合作行为。
-
单位中国人民解放军装甲兵工程学院