摘要

为提升普通话测试的效果,提出一种基于神经网络的语音自动增强方法,以提高测试语音的清晰度。通过将独立自注意力机制与全卷积神经网络进行融合,以解决全卷积神经网络存在的感受域内放缩特性差的问题,提升语音增强方法的整体性能。结果表明,基于独立自注意机制融合全卷积神经网络的语音增强算法SAUNet能够取得良好的语音增强效果,与AAUNet和UNet两种语音增强方法相比,在评价指标SIG、BAK、OVL、PESQ以及STOI上分别提高了17.4%和8.7%、13.44%和8.27%、15.47%和1054%、15.45%和7.58%、9.25%和6.88%。实验结果表明本研究提出的语音增强方法的性能优越,能够使得计算机辅助下的普通话测试取得更好的测试效果,具有一定实际参考设计价值。

全文