摘要

如何增强模型在对抗样本攻击下的鲁棒性是一个重要研究方向。本文提出一种提高图像识别模型鲁棒性的方法。该方法由弱化操作和强化操作组成。弱化操作弱化原生输入的像素值,破坏对抗扰动的结构,这个过程减少了图片中的对抗扰动但也丢失了一些空间语义信息,这部分丢失的语义信息由强化操作补全。强化操作由特征提取器和特征选择器构成,特征提取器用于提取合适的图像特征图。为了从这些特征图中选择鲁棒的部分,设计一个特征选择器用于融合特征图的内容并输出扰动较小且富含空间语义信息的特征图。通过大量的对比实验证实了方法抵御对抗样本的有效性并揭示了对抗扰动的误差积累现象。