藏语N-gram语言模型中的平滑技术研究

作者:仁青吉
来源:西北民族大学学报(自然科学版), 2019, 40(04): 26-30.
DOI:10.14084/j.cnki.cn62-1188/n.2019.04.005

摘要

文章在Linux环境下搭建Srilm建模平台,然后对语料进行分块处理,并用N-gram count和N-gram进行计数和语言模型的建立,利用几种平滑算法对其进行了困惑度的测试,最后对这几个困惑度的数值进行比较和数据分析,总结出一个适用于当前语料和语言环境下最优的平滑方法.