基于改进的SEGAN空管语音增强算法

作者:王宇哲; 黎新*; 牟睿; 周继华; 何怡甫
来源:北京航空航天大学学报, 2023, 1-13.
DOI:10.13700/j.bh.1001-5965.2022.0874

摘要

为了提高空中交通管制过程中语音通话质量,提出了一种改进的SEGAN空管语音增强算法。针对传统的基于生成对抗网络的语音增强算法(SEGAN)在低信噪比条件下,语音信号被淹没的问题,在SEGAN网络模型的基础上提出了多阶段,多映射,多维度输出的生成器和多尺度,多个鉴别器的网络模型。首先,基于深层神经网络结构提取语音语义特征,完成空管语音语义分段。其次,设置多个生成器,对语音信号做进一步优化处理。然后,在卷积层中添加下采样模块,以提高模型对语音信息的利用率,减少语音信息的流失。最后,采用多尺度,多个鉴别器,多方位学习语音样本的分布规律和信息。结果表明,在低信噪比条件下,改进的SEGAN模型短时客观可懂度(STOI)和语音质量感知评估(PESQ)分别提高了23.28%和20.11%,能够快速有效的进行空管语音增强,为后续空管语音识别提供准备工作。

全文