摘要
为提高图像分类神经网络的鲁棒性,提出一种基于k-WTA的对抗样本防御模型Att-k-DefGAN.模型在Rob-GAN的基础上做出改进,并利用k-WTA激活函数的不连续性与模型训练中的对抗攻击预处理形成对抗,进一步提高分类神经网络的鲁棒性.实验结果表明,在CIFAR-10数据集和ImageNet子集上,Att-k-DefGAN训练得到的分类器鲁棒性要优于Rob-GAN和对抗训练方法 .通过对比有无k-WTA激活函数的模型在不同强度攻击方法(PGD,MI-FGSM)下的分类准确度,证明k-WTA可以有效提高模型对梯度攻击的防御能力.
- 单位