摘要
针对传统声纹识别方法实现过程复杂、识别率低等问题,提出了一种基于ResNet-LSTM的声纹识别方法.首先采用ResNet残差网络提取声纹的空间特征,其次采用LSTM长短期记忆循环神经网络提取声纹的时序特征,通过ResNet与LSTM结合的特征提取方法获得了同时包含空间特征与时序特征的深度声纹特征.实验结果表明,采用ResNet-LSTM网络的声纹识别方法的等错误率降低至1.196%,较基线方法 d-vector以及VGGNet分别降低了3.68%与1.95%,识别准确率达到了98.8%.
- 单位