摘要
由于对非平稳噪声进行估计是提高含噪语音降噪效果的重要影响因素,因此利用卷积模块提高单帧含噪语音所包含的信息,并通过Transformer中的自注意力机制模块,使模型能够更加精确区分含噪语音中的噪声部分和语音部分,从而使转置卷积模块更加高效的完成语音降噪。针对Noisex-92噪声库中的15种噪声,分别应用LSTM网络、卷积循环网络和基于通道注意力机制的卷积循环网络模型进行对比分析,同时对测试集含噪语音进行降噪处理。实验结果表明,经过所提出的基于自注意力机制的卷积循环网络降噪后的语音在PESQ和STOI评分上均有较大提高,语谱图显示有效减少了噪声的残留。
-
单位中国政法大学; 中国刑事警察学院