基于ResNet-LSTM的声纹识别方法

作者:刘勇*; 梁宏涛; 刘国柱; 胡强
来源:计算机系统应用, 2021, 30(06): 215-219.
DOI:10.15888/j.cnki.csa.007934

摘要

针对传统声纹识别方法实现过程复杂、识别率低等问题,提出了一种基于ResNet-LSTM的声纹识别方法.首先采用ResNet残差网络提取声纹的空间特征,其次采用LSTM长短期记忆循环神经网络提取声纹的时序特征,通过ResNet与LSTM结合的特征提取方法获得了同时包含空间特征与时序特征的深度声纹特征.实验结果表明,采用ResNet-LSTM网络的声纹识别方法的等错误率降低至1.196%,较基线方法 d-vector以及VGGNet分别降低了3.68%与1.95%,识别准确率达到了98.8%.

全文