摘要
监督性语音分离利用有监督学习算法,建立输入带噪语音信号和输出目标信号之间的映射关系.近年来,随着深度学习理论的发展,监督性分离算法已经成为语音分离最重要的研究方向,计算目标对分离算法的性能有着重要影响.理想浮值掩蔽作为常用的分离目标,能够提升分离的语音可懂度和语音质量,但没有考虑噪声和语音之间的相关性.本文采用优化浮值掩蔽作为分离目标,利用深度神经网络(Deep neural network, DNN)作为分离模型,并在多种噪声环境和信噪比条件下进行对比实验.结果表明,优化浮值掩蔽对语音感知质量有显著提升,总体上分离性能优于其他计算目标.
-
单位模式识别国家重点实验室; 中国科学院自动化研究所; 内蒙古大学