摘要
未来海战场形势瞬息万变,亟需依托人工智能技术实现对海战场环境的高质量作战仿真,以全面优化和提升我军战斗力,达成克敌制胜的目的。作战单元的协同合作是实现海战场作战仿真的关键环节,如何实现多智能体之间的均衡决策是作战仿真首要解决的问题。基于解耦的优先经验回放机制和注意力机制,提出强化学习驱动的多智能体协同作战仿真算法MARL-CCSA(Multi-Agent Reinforcement Learning-based Cooperative Combat Simulation)。在MARL-CCSA基础上,利用专家经验,设计一种多尺度奖励函数,并基于此函数构建一个海战场作战仿真环境,使MARL-CCSA在此环境中训练易于收敛。最后,设计想定进行仿真实验,并与其他算法的效果进行对比,验证MARL-CCSA的可行性与实用性。
- 单位