摘要

为了提升多语音对话机器人在英语语音交流过程中的去噪性能,研究在深度神经网络(Deep Neural Network, DNN)模型的语音增强算法基础上,提出一种时频掩码优化的二阶段英语语音增强算法。该算法通过两阶段网络提升多语音对话机器人英语语音增强性能,设置目标函数为时频掩码优化函数,利用相位信息系数和增益系数提升网络去噪性能。特征拼接系统的两种评价指标均高于单一特征系统。相较于其他类型的深度学习算法,时频掩码优化的二阶段英语语音增强算法具有更理想的客观英语语音质量评价性能。当信噪比(Signal-Noise Ratio, SNR)为5 dB时,时频掩码优化的二阶段英语语音增强算法的STOI和PESQ分别为0.752和2.865,数值均为最高。所构建的二阶段英语语音增强算法能适应多种类型的噪音环境,具有较强的英语语音噪声抑制作用,能保留较为完整的英语语音结构信息,丰富了英语语音增强理论,可应用于智能设备的英语语音增强领域。

  • 单位
    咸阳职业技术学院

全文