低资源条件下基于i-vector特征的LSTM递归神经网络语音识别系统

黄光许; 田垚; 康健; 刘加; 夏善红

摘要

在低资源条件下,由于带标注训练数据较少,搭建的语音识别系统性能往往不甚理想。针对此问题,首先在声学模型上研究了长短时记忆(LSTM)递归神经网络,通过对长序列进行建模来充分挖掘上下文信息,并且引入线性投影层减小模型参数;然后研究了在特征空间中对说话人进行建模的技术,提取出能有效反映说话人和信道信息的身份认证矢量(i-vector);最后将上述研究结合构建了基于i-vector特征的LSTM递归神经网络系统。在Open KWS 2013标准数据集上进行实验,结果表明该技术相比于深度神经网络基线系统有相对10%的字节错误率降低。

单位
清华大学; 中国科学院大学; 中国科学院电子学研究所; 传感技术国家重点实验室; 清华信息科学与技术国家实验室

收藏分享被引浏览

更新时间：2024-05-12 05:28

低资源条件下基于i-vector特征的LSTM递归神经网络语音识别系统

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友