基于集成advGAN的黑盒迁移对抗攻击

作者:黄帅娜; 李玉祥; 毛岳恒; 班爱莹; 张志勇*
来源:吉林大学学报(工学版), 2022, 52(10): 2391-2398.
DOI:10.13229/j.cnki.jdxbgxb20210891

摘要

针对传统advGAN方法可高效地生成高保真度的对抗样本,但advGAN容易过拟合于原始样本空间流形导致迁移性变差的问题,,提出了一种集成advGAN的方法。在生成对抗网络中添加由多个分类模型的logits集成构成目标分类模型,汇聚所有模型输出的期望,着力降低过拟合现象,使得生成的对抗样本迁移性强且保真度高。在MNIST数据集上,使用集成advGAN方法生成的对抗样本迁移攻击成功率平均提高了6%,最高可达43.9%,在CIFAR-10数据集上,对抗样本迁移攻击成功率平均提高了7.6%,最高可达75.62%,且PSNR比起传统advGAN有提升。实验结果表明:集成advGAN方法可以生成具备更高对抗迁移性的高保真对抗样本。