摘要
深度网络分类模型在对抗样本的攻击下存在着对机器学习应用的安全性问题。针对该问题,设计并运用宽度学习来抵御对抗攻击,旨在提高智能系统对对抗样本的分类准确率,从而提升系统的安全性。同时,为了验证上述方法对抵御对抗样本攻击的有效性,首先设计优化宽度学习网络,对标准公共对抗数据集DAmageNet进行验证,实验结果表明,该网络对于对抗样本的验证准确率最高可从57.33%提升到80.67%,提高了23.34个百分点。然后,运用该优化网络对混合了FGSM、C&W、JSMA、Deepfool四种攻击方法的乳腺摄影图数据集(Mammographic Image Analysis Society)进行训练。通过大量的实验证明,宽度网络能够有效提高对抗样本中攻击方法的分类准确率,验证准确率可从55.00%提升至80.75%,较加宽前网络结构提高了25.75个百分点。对抗样本目标图像选取的位平面不同时,宽度网络抵御攻击的能力不同,通过创新性提出切割位平面的可解释方法进行研究,选取其中一种攻击方法(FGSM)进行解释,对宽度学习模型抵御攻击方法的内部机理进行分析。
- 单位