低数据资源条件下基于Bottleneck特征与SGMM模型的语音识别系统

吴蔚澜; 蔡猛; 田垚; 杨晓昊; 陈振锋; 刘加; 夏善红

摘要

语音识别系统需要大量有标注训练数据,在低数据资源条件下的识别性能往往不理想.针对数据匮乏问题,本文先研究子空间高斯混合声学模型通过参数共享减少待估计的参数规模,并使用基于最大互信息准则的区分型训练技术提高识别精度;而后在特征层面应用基于深度神经网络的Bottleneck特征来达到特征提取和降维的目的;最后将上述研究成果结合并构建了低资源条件下的语音识别系统.在国际标准的Open KWS 2013数据库上的实验结果表明,本文的技术能够有效改善低资源条件下的系统识别性能,相比基线系统有12%左右的词错误率降低.

单位
清华信息科学与技术国家实验室; 中国科学院大学; 清华大学; 中国科学院电子学研究所; 传感技术国家重点实验室

收藏分享被引浏览

更新时间：2024-05-18 12:57

低数据资源条件下基于Bottleneck特征与SGMM模型的语音识别系统

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友