摘要
多智能体对抗仿真建模技术在军事上具有重要作用,其中强化学习深度增强网络(DQN)是重要的建模技术。随着体系对抗建模中环境输入信息及智能体数量的增加,DQN的复杂性不断增长,而单纯采用强化学习技术只能通过极度稀疏的对抗胜负结果提供反馈进行训练,模型训练的收敛速度是一个难题。探讨在多智能体对抗建模中采用基于生成对抗网络(GAN)的模仿学习方法,通过对回放数据的模仿学习,采用生成对抗网络的对抗训练技术,直接学习智能体在不同状态下的行动策略,从而加快了模型的训练速度,可以快速建立具备高度智能性的多智能体模型,并为模型的进一步优化提供基础。