摘要

本文初步探索了深度学习模型脆弱性,存在的潜在原因之一归结于其网络结构中高度敏感的局部线性行为。而对抗性训练的提出,旨在对抗扰动的训练集上训练深度学习模型,是一种有效的正则化方法,可缓解其脆弱性问题。由于传统对抗性训练算法依赖于已知攻击算法,在抵御其攻击时性能十分有限,而基于特征掩膜(Feature Mask)和特征填补(Feature Padding)的对抗性训练防御策略的提出,不仅不依赖于对抗样本,还能提高深度学习模型的鲁棒性及安全性,并在公开交通标识识别和人脸识别数据集上,验证了所提对抗性训练防御策略在对抗环境下较优的防御性能。

  • 单位
    江苏联合职业技术学院南京工程分院