摘要
提出一种应用于噪声环境下语音识别的基于Gammatone滤波器组的语音特征。相较于传统基于滤波器组的语音特征,该特征值将传统的应用于频域傅里叶变换(Fast Fourier Transform,FFT)的滤波器组的频域分布特点转化为缩放系数,直接应用在频域缩放用于生成倒谱系数的基向量。该信号处理方式最大程度地保留了语音信号频域原有细节。在此基础上,所提出的方法还针对噪声信号的特点对特征生成过程中的分帧长度进行了优化。实验验证了该方法在噪声环境下语音识别的鲁棒性。
-
单位中国电子科技集团公司信息科学研究院; 中国电子科技集团公司第三研究所