摘要

三音素决策树为声学模型生成上下文相关的识别单元,是影响声学模型性能的关键技术。为了有效降低维吾尔语语音识别的词错误率,分别从基线系统的总体结构、三音素决策树模型的构建和训练流程、以及决策树构建算法本身三个不同的层次和视角,结合维吾尔语语音识别在发音音素标注集、根节点文件配置等方面的特点,拟定三音素决策树相关参数的调优方案。增加最大叶子数使决策树的分裂更充分,增大总高斯数,使每个叶子节点所对应的高斯混合模型精度更高,从而提升声学模型的性能。实验结果表明,通过提高最大叶子数和总高斯数,在基线系统的典型配置条件下,使词错误率下降13.1%。