摘要
本文提出了一种基于门控循环单元(GRU)的多层RNN滤波网络模型。通过训练RNN网络来学习含噪音频信号的时间相关性和局部模式,从而实现对实时语音的前端降噪处理。使用PESQ和STOI指标对滤波结果进行评价,结果显示相比传统的谱减法和Wiener法等滤波方法,基于RNN滤波模型的降噪技术在人耳感知效果方面更优。实验结果表明,该技术能够在降噪的同时保持语音的可识别度,减少厨房环境噪音对后续语音识别的影响。
- 单位
本文提出了一种基于门控循环单元(GRU)的多层RNN滤波网络模型。通过训练RNN网络来学习含噪音频信号的时间相关性和局部模式,从而实现对实时语音的前端降噪处理。使用PESQ和STOI指标对滤波结果进行评价,结果显示相比传统的谱减法和Wiener法等滤波方法,基于RNN滤波模型的降噪技术在人耳感知效果方面更优。实验结果表明,该技术能够在降噪的同时保持语音的可识别度,减少厨房环境噪音对后续语音识别的影响。