摘要
本发明公开了一种神经网络下基于敏感度的鲁棒性训练防御方法,该方法通过在样本周围构造高斯邻域生成敏感度样本,让神经网络同时关注模型分类损失和模型敏感度度量,又通过权衡系数对二者进行平衡,从而显著提高了神经网络模型对逃逸攻击的抵抗能力,通过在原始样本周围构造敏感度样本来将模型的分类误差和敏感度度量结合起来作为最终的误差进行反向传播,让模型不仅仅关注分类误差,同时关注模型敏感度。敏感度训练能够让模型获得更可靠的决策边界,经过敏感度训练后的决策边界距离样本更远,这增加了攻击者的攻击成本,从而有效地提高模型的防御能力。
- 单位