摘要
随着互联网信息指数性增加,海量语音数据的特征具有很大的非特定人差异性和噪声干扰性,常用的特征提取以及特征变换方法已经很难满足当前模型训练识别的需求。近些年来立足于语音识别和深度学习理论的紧密结合,通过研究发现卷积神经网络的结构十分适合语音信号的特征提取过程,文中提出一种基于卷积神经网络的特征提取方法,并且结合相对复杂的GMM-HMM模型组成新的语音识别系统。实验表明,卷积神经网络结构可以很好的克服语音信号的非特定人差异性以及噪声的影响,GMM-HMM模型相比softmax分类器更为切合语音复杂信号的建模,最终识别率有了很大的提升。
-
单位西安邮电大学; 经济管理学院