摘要

为了进一步提高语音增强算法的性能,提出了一种基于注意力机制和残差卷积网络的语音增强算法。该方法在卷积神经网络中添加残差学习网络和注意力机制,首先对语音信号进行短时傅里叶变换提取语谱图特征,然后利用神经网络训练得到非线性映射,最后通过逆-短时傅里叶变换重构语音信号。通过仿真实验表明,提出的基于注意力机制和残差卷积网络的语音增强方法在低信噪比的情况下,能够有效地提高语音质量,并且有良好的泛化能力。