维吾尔语三音素决策树的欠拟合调优

阿依先木·卡得尔; 邱自成<sup>*</sup>

摘要

三音素决策树为声学模型生成上下文相关的识别单元,是影响声学模型性能的关键技术。为了有效降低维吾尔语语音识别的词错误率,分别从基线系统的总体结构、三音素决策树模型的构建和训练流程、以及决策树构建算法本身三个不同的层次和视角,结合维吾尔语语音识别在发音音素标注集、根节点文件配置等方面的特点,拟定三音素决策树相关参数的调优方案。增加最大叶子数使决策树的分裂更充分,增大总高斯数,使每个叶子节点所对应的高斯混合模型精度更高,从而提升声学模型的性能。实验结果表明,通过提高最大叶子数和总高斯数,在基线系统的典型配置条件下,使词错误率下降13.1%。

单位
塔里木大学

收藏分享被引(1) 浏览

更新时间：2024-04-24 00:05

维吾尔语三音素决策树的欠拟合调优

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友