面向中文短文本情感分析的改进特征选择算法

作者:王荣波; 沈卓奇; 黄孝喜; 谌志群
来源:杭州电子科技大学学报(自然科学版), 2019, 39(01): 45-50.
DOI:10.13954/j.cnki.hdu.2019.01.009

摘要

在中文短文本情感分析的特征提取中,词频逆文本频率指数算法TF-IDF存在特征词分布计算片面性的缺陷,信息增益算法IG不能很好地提取短文本特征,为此,提出了一种改进特征选择算法ITFIDF-IG。根据短文本语料特点提高更具分类效果的特征词权重,降低了无关词的干扰,并考虑特征词在分布上体现的分类效果,有效提取出更具分类贡献度的特征词,更适应中文短文本的情感分析,取得较好的分类性能。

全文