摘要

目前存在的深度学习网络模型在面对对抗性攻击时,并不具有鲁棒性。特别是基于决策的对抗攻击,这种对抗攻击仅仅依赖于深度学习模型输出的标签就成功攻击深度学习网络模型。目前基于决策的攻击有两个不可逃避的缺点,首先是查询次数太多,其次就是逃避检测的问题。针对这些缺点,提出了一种改进频率二分法的对抗性攻击方法,这种攻击通过傅里叶变换将图片转为频域,然后通过二分法挑选图片中不重要的高频区域,将其更改,通过实验在限制查询次数和扰动大小的情况下攻击成功率高达56.33%,被检测率仅仅为18.18%,攻击效果高于同类型攻击方法,在现实应用研究中,具有重要意义。

全文