摘要

本发明提供一种鲁棒智能合成语音说话人确认模型的训练方法、系统、存储介质和电子设备,涉及语音处理技术领域。本发明提供的鲁棒智能合成语音说话人确认模型,用于提高强背景噪声条件下智能合成语音的说话人确认精确度,包括语音增强网络、特征提取网络和特征增强模块。在模型的训练阶段,带噪智能合成语音数据集的训练集经过STFT特征预处理和Fbank特征预处理后分别输送到语音增强网络、特征提取网络中,并通过特征增强模块将两个网络建立联系进行联合训练,获取具有抗噪鲁棒性的说话人嵌入特征。在测试阶段,基于带噪智能合成语音数据集的测试集进行模型测试;重复执行前述训练测试交替进行的方式进行最优模型选择,直到训练迭代次数达到设定最大值。