摘要
为了应对视频监控和社交网络分享等真实场景中深度神经网络对图像信息的过度挖掘,提出了一种稀疏对抗攻击样本的生成方法,旨在对抗深度神经网络,致其错误分类,无法完成后续未授权任务。对扰动像素数量、扰动幅度以及扰动位置等多个目标进行优化,并基于抽样方案简捷高效地生成对抗样本。与其他5种相关方法对比了对抗成功率、扰动像素数量、扰动幅度、扰动位置和优化效果等指标,并根据扰动像素的分布情况分析了目标模型的分类空间特征。通过迁移测试和在目标检测任务中的应用,对本文算法的泛化能力和实用性进行了评估。实验结果表明,算法在扰动率不超过1%的情况下,依然可以保证对深度神经网络的有效对抗,并显著优化了扰动像素幅度及扰动位置,对原始图像的破坏性更小,扰动更加不易感知。算法具有良好的泛化性和实用性。
- 单位