摘要

本发明公开了一种基于约束朴素生成对抗网络的语音增强方法,包括步骤:1)噪声数据收集和标记;2)语音分帧加窗;3)幅度压缩;4)输入约束朴素生成对抗网络训练;5)幅度解压缩;6)逆短时傅里叶变换,生成增强语音。本发明的优点是:通过生成对抗网络中的生成模型和判别模型之间的对抗学习,不断增强生成模型生成样本的能力,最终得到干净语音样本的分布;对语音或噪声的统计分布没有任何假设;采取复数谱映射的方法,在训练样本中增加了相位信息。本发明巧妙地解决了语音和噪声信号分布难以估计问题,有助于提高语音可懂度,避免相位失真。