跨语言声学模型在维吾尔语语音识别中的应用

作者:努尔麦麦提·尤鲁瓦斯; 刘俊华; 吾守尔·斯拉木; 热依曼·吐尔逊; 达吾勒·阿布都哈依尔
来源:清华大学学报, 2018, 58(04): 342-346.
DOI:10.16511/j.cnki.qhdxxb.2018.22.020

摘要

对维吾尔语而言,由于数据采集和标注存在各种困难,用于训练声学模型的语音数据不够充分。为此,该文研究了基于长短期记忆网络的跨语言声学模型建模方法,利用汉语庞大的训练数据训练深度神经网络声学模型,然后将网络的输出层权重去掉,用随机化的方式产生与维吾尔语输出层对应的权重值,采用反向传播的方式,利用维吾尔语语音数据更新所有权重来训练维吾尔语声学模型。实验结果表明:该方法使维吾尔语转写和听写识别错误率分别比基线系统相对降低了20%和30%。该方法利用汉语大数据来训练神经网络的隐藏层,使维吾尔语声学模型能在一个较好的初始权重网络上进行训练,增强了网络的鲁棒性。