摘要

为了解决当前声纹对抗攻击算法梯度信息利用不足、迁移性较差等问题,针对说话人识别模型,提出一种时空迭代快速梯度符号法(Space-Time Iterative Fast Gradient Sign Method, STI-FGSM)的声纹对抗攻击算法。该算法首先基于动量迭代快速梯度符号法(Momentum Iterative Fast Gradient Sign Method, MI-FGSM),融合动量和时序梯度信息,使用下一步观测梯度修正扰动更新方向。然后,引入空间梯度信息,充分学习语音样本区域信息,实现不同区域的空间梯度动量累加。最后,结合扰动集成的方法,充分利用已知的白盒模型,实现多模型扰动叠加,进一步提高黑盒攻击成功率。实验结果表明,STI-FGSM算法针对ResNetSE34V2、TDy_ResNet34_half、x-vector、ECAPA-TDNN四种说话人识别模型,均能取得较强的白盒攻击,并实现较高的黑盒攻击成功率,其性能优于其他算法。