摘要

针对梅尔频谱倒谱、梅尔标度滤波器组特征提取、瓶颈特征等常用语音特征对语音前后帧相关性信息提取不足、冗余信息较多导致识别率不高的问题,对此改进了深度神经网络的语音瓶颈特征提取方法。该方法利用重叠组套索算法增强表征力、L2,1范数稀疏正则化对深度神经网络语音瓶颈特征提取进行改进,经过梅尔频谱倒谱声学特征提取进行二次特征提取,获得表征能力较强、具有稀疏性的语音瓶颈特征。实验结果表明,改进的深度神经网络语音瓶颈特征与原始的梅尔频谱倒谱特征提取方法相比,语音识别错误率降低了3.25%。