摘要
语音增强能有效解决人机交互和语音识别等技术中的噪声干扰问题。为了提高语音增强的效果,提出了一种结合高效通道注意力机制的生成对抗网络,并在两种不同的数据集下进行实验。该方法通过在生成对抗网络的生成器中加入高效的通道注意力机制来提高抑制无关于语音增强的信息来提高模型的灵活度与准确率。该模型在Nonspeech-100数据集相较于基线模型下语音感知质量评估(PESQ)平均提升了2.79%,语音短时客观可懂度(STOI)平均提升了0.95%;在NoiseX-92数据集下,ESQ平均提升了3.8%,STOI平均提升了2.03%。实验结果表明,该方法在没有增加很大的计算量的情况下提高了模型的性能。
-
单位内蒙古科技大学; 中国电子技术标准化研究院