摘要
为了解决零和博弈(Zero-sum Game)的GAN(Generative Adversarial Networks)模型中传统对抗性神经网络的判别器损失值过高问题,改进了对抗性神经网络的代价函数.在零和博弈的非完备信息中,由于博弈对抗的生成器与判别器双方互知的MNIST数字图像信息是有限的,为了恰当的分析出博弈过程中某种因素在对抗中的作用,代价函数在零和博弈对抗神经网络中显得尤为重要.对零和博弈对抗环境中的代价函数选择与性能评价进行相关研究,进而实现获取较大优势的零和博弈.实验表明:改进型对抗性神经网络的代价函数优于传统对抗性神经网络损失函数方法.
-
单位复杂系统智能控制与决策国家重点实验室; 北京理工大学; 自动化学院