摘要
深度神经网络在多种人工智能任务中有广泛的应用,然而研究表明深度神经网络在对抗样本的攻击下会输出完全错误的预测结果,整体模型的准确性受到很大影响.如何提高网络针对对抗样本的稳健性,是研究者亟需解决的问题.本文提出了一种基于自监督重建的提高网络稳健性的方法,以图像去噪为基础,设计一种去噪模型,与网络联合训练,并加入自监督重建信号辅助训练.在对抗样本进入网络前,利用去噪模型去除对抗噪声,避免其对网络的干扰.公开数据集上的实验表明,本模型在多种攻击方法下都有较高的分类准确率,表明模型针对对抗样本具有很强的稳健性.
- 单位