摘要
为提高传统MFCC等声学特征及深度卷积神经网络的识别性能和对背景噪声的适应性,提出基于改进MFCC特征和改进RCNN网络的说话人识别算法.算法首先提取说话人语音的改进MFCC特征并进行了特征补偿和特征降维,以优化说话人的特征提取性能;然后采用池化层优化和残差卷积改进的DCNN网络进一步对准帧间信息,以提高说话人识别的特征学习准确性和对复杂背景干扰的适应性.实验结果表明,相比于i-vector和GMM-UBM识别框架及传统MFCC特征,文中算法取得最优的识别准确率和识别均方误差.
-
单位辽东学院