面向视觉分类模型的投毒攻击

梁捷; 郝晓燕<sup>*</sup>; 陈永乐

摘要

数据投毒攻击中的后门攻击方式的攻击者通过将带有隐藏触发器的样本插入训练集中来操纵训练数据的分布，从而使测试样本错误分类以达到改变模型行为和降低模型性能的目的。而现有触发器的弊端是样本无关性，即无论采用什么触发模式，不同有毒样本都包含相同触发器。因此将图像隐写技术与深度卷积对抗网络（DCGAN）结合，提出一种基于样本的攻击方法来根据灰度共生矩阵生成图像纹理特征图，利用图像隐写技术将目标标签字符嵌入纹理特征图中作为触发器，并将带有触发器的纹理特征图和干净样本拼接成中毒样本，再通过DCGAN生成大量带有触发器的假图。在训练集样本中将原中毒样本以及DCGAN生成的假图混合起来，最终达到投毒者注入少量的中毒样本后，在拥有较高的攻击率同时，保证触发器的有效性、可持续性和隐藏性的效果。实验结果表明，该方法避免了样本无关性的弊端，并且模型精确度达到93.78%，在30%的中毒样本比例下，数据预处理、剪枝防御以及AUROR防御方法对攻击成功率的影响达到最小，攻击成功率可达到56%左右。

单位
太原理工大学

收藏分享被引浏览

更新时间：2024-03-18 17:50

面向视觉分类模型的投毒攻击

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友