摘要

针对蒙古语语料少导致蒙古语说话人自适应语音识别系统效果差的问题,该文提出一种基于Ⅰ-vector特征融合的说话人特征提取方法。首先在低资源语料和高资源语料上分别训练Ⅰ-vector模型,之后利用两者训练得到的Ⅰ-vector特征作为中间数据进行最后的特征融合训练。在蒙古语和TIMIT语料库上的实验结果表明,融合训练后Ⅰ-vector说话人特征表现较优,与融合前的Ⅰ-vector特征相比,平均WER降低了0.7%,平均SER降低了3.1%。