摘要
针对语种识别在噪声环境下识别率低的问题,提出了一种基于对数Gammatone滤波器能量特征谱图的语种识别方法。依据Gammatone滤波器组的听觉特征提取出对数Gammatone滤波器能量特征,并将特征转化为图像获得特征谱图,然后运用暗通道先验算法对特征图进行增强去噪,最后使用残差神经网络模型进行训练识别。实验表明,在信噪比为0 dB,噪声源分别为白噪声、车内噪声和粉红噪声时,该方法相对于线性灰度语谱图识别率分别提升了32.7%、10.1%和29.1%,且在其他信噪比下的识别率也有一定的提升。
-
单位自动化学院; 昆明理工大学