维吾尔文情感分类特征建设研究

作者:热西旦木·吐尔洪太; 吾守尔·斯拉木
来源:计算机应用研究, 2019, 36(12): 3548-3552.
DOI:10.19734/j.issn.1001-3695.2018.04.0378

摘要

由于目前缺乏维吾尔文情感分类特征表示方面的系统性研究,以传统n-gram特征为基础,按不同规模从维吾尔文情感标注语料库中提取了新特征及其组合特征,基于支持向量机(SVM)分类器对维吾尔文情感语料库进行了正负情感分类。实验结果表明,所提取的基本特征中unigram特征的分类效率最佳; unigram特征与词组特征的组合可以进一步提高分类效率,其最佳分类效果比unigram特征的分类效果提高了1. 78%。首次在统一标注数据集上对不同特征的分类性能进行了综合评价,研究成果可以为今后的维吾尔文情感分类研究提供指导。