摘要

基于深度学习的图像分类器已经被广泛使用,由于模型鲁棒性问题导致其不能正确分类,进而增加微小扰动的样本,称之为对抗攻击。现有黑盒攻击算法难以在较低的访问次数下获得准确决策边界信息,本文提出基于拟合决策边界表达式的对抗攻击方法。该方法定义根据目标函数以及决策边界的定义,推导出决策边界表达式,并利用投影操作寻找决策边界附近的对抗样本。试验结果标明,该方法相比现有的黑盒攻击方法具有更高的攻击成功率。