摘要

在计算机视觉任务中深度神经网络模型易受对抗样本的干扰,泛化性能高的对抗样本会影响更多的模型。为了研究深度神经网络模型的脆弱性进而改善该现状,提出一种基于类梯度的全局对抗样本生成方法。以图像中的目标类为单位快速进行类梯度收集,通过一次性融合同一类别内所有目标的梯度来体现类内相似性与类间差异性。在此基础上,结合数据集中一定比例的图像及对应的图片尺度扰动生成全局扰动。通过上述过程突破模型候选框及图片数量的制约,生成的全局扰动可以对大量数据形成有效的影响。实验结果表明,该方法在Pascal VOC和MS-COCO-keypoints数据集的2种计算机视觉任务中性能均优于PGD、FPE等算法,其攻击成功率比DAG算法高1个百分点,比FPE算法高34个百分点,同时推断扰动速度较快。全局扰动的存在揭示了深度神经网络模型在高维决策边界之间存在一定的几何相关性,利用所提方法有助于深度神经网络抵抗泛化性能更高的全局对抗样本。

全文