摘要

现有的大多数语音取证算法都集中于某一种伪造操作的检测。如果使用这些检测算法对其他伪造的操作进行检测,通常会导致检测结果的误判。针对该问题,提出了一种基于残差特征的卷积神经网络(CNN)来检测包括变调、加噪等四种伪造操作的数字语音。在提出的方法中采用固定的模板来提取语音残差输入网络,然后经过卷积层组转换为残差特征在网络中进行训练,最后使用Softmax分类器对测试语音进行分类。通过在TIMIT语音库上的实验表明,该残差特征可达到99%的检测率,并且对MP3的压缩也有很好的鲁棒性。