基于无监督迁移分量分析的语种识别

徐嘉明; 张卫强; 刘加; 夏善红

doi:10.16511/j.cnki.qhdxxb.2013.06.014

摘要

训练数据和测试数据之间由于信道等差异而引起的不匹配会严重影响语种识别的性能。而在实际应用中,通常只能获得少量的和测试数据匹配的标注数据(目标域数据),以及大量的和测试数据不匹配的标注数据(源域数据)。该文利用迁移学习的方法,通过无监督迁移分量分析(unsupervised transfer component analysis,UTCA),可以合理利用上述两种数据寻找到一个低维子空间,在该空间中,源数据和目标数据之间的分布差异最小,而且数据中有利于分类的属性得以保留,从而提高系统识别性能。实验表明:相对于基线系统,该算法对30s和10s语音的识别性能分别有24.7%和8%的提高。

单位
清华信息科学与技术国家实验室; 传感技术国家重点实验室; 清华大学; 中国科学院电子学研究所; 中国科学院大学

全文

访问全文

收藏分享被引浏览

更新时间：2020-06-17 23:58

基于无监督迁移分量分析的语种识别

摘要

全文

产品服务

站内浏览

服务支持

联系方式

科研之友