基于门控残差卷积编解码网络的单通道语音增强方法

张天骐; 柏浩钧; 叶绍鹏; 刘鉴兴

doi:10.16798/j.issn.1003-0530.2021.10.023

摘要

针对卷积编解码网络(CED, Convolution encoder-and-decoder)对语音时序相关信息捕获困难的问题,本文提出了一种基于门控残差卷积编解码网络的语音增强方法。该方法在卷积编解码网络的基础上引入了门控机制、膨胀卷积与残差连接:门控机制能够很好地处理序列前后相关信息;膨胀卷积使得卷积过程获得更大的感受野,提取更加丰富的全局信息;残差连接能够防止梯度消失与梯度爆炸,提升网络精度。此外,采用频域损失函数与时域评价指标联合优化的策略对网络进行训练,以进一步提升网络增强效果。实验表明,在匹配噪声和不匹配噪声下,相比于基线CED与其他对比方法,本文方法取得了更高的PESQ、STOI与SI-SDR,对语音的清浊音都有较好恢复效果,且具有较强的泛化能力。

单位
重庆邮电大学; 通信与信息工程学院

全文

访问全文

收藏分享被引浏览

更新时间：2024-04-18 01:52

基于门控残差卷积编解码网络的单通道语音增强方法

摘要

全文

产品服务

站内浏览

服务支持

联系方式

科研之友