摘要
为了解决复杂背景噪声环境中语音活动检测(voice activity detection,VAD)命中率较低的问题,提出具有环境意识的VAD算法。针对常用算法中采用单阈值抗噪性差的不足,对语音帧和噪声帧相互转换过程采用不同阈值,并对两个阈值进行自适应更新;为克服单一特征无法应对复杂环境的缺陷,提出将统计模型似然比、能量熵特征和平均谐波数量值特征等进行特征联合的方法;引入环境噪声分类的思想,利用支持向量机对噪声环境进行分类,并根据噪声类型选择最优特征组合,进一步提升算法性能。使用NOIZEUS语音库,以babble、pink、white、f16、volvo这5类噪声作为背景噪声,通过仿真实验评估了所提出算法的性能,比较了各类特征组合的命中率。实验结果证明,所提方法的识别效果优于现有算法,针对各种噪声可取得约80%的总体命中率,且能更好地平衡语音命中率和虚警率。
-
单位南京航空航天大学; 自动化学院