摘要

针对现有的方法在低信噪比环境下语种识别性能不佳,提出了一种耳蜗滤波系数和声道冲激响应频谱参数相互融合的语种识别方法.该方法表征了人的耳蜗听觉特性和发声特性,首先提取模拟人耳听觉特性的耳蜗滤波系数,再融合表征人的发声特性的声道冲激响应频谱参数,最后采用高斯混合通用背景模型对所提方法在语种识别上进行测试.实验结果表明,在4种信噪比环境下,该方法优于其他对比方法,相对于基于深度学习的对数Mel尺度滤波器能量特征,识别正确率提升了16.1%,相对于其他方法也有较大程度的性能提升.