基于标签传播的评教文本情感词典构建

作者:麻孟越; 张琨*; 严霞; 景鸿斐
来源:内蒙古大学学报(自然科学版), 2019, 50(03): 324-330.
DOI:10.13484/j.nmgdxxbzk.20190314

摘要

情感词典是情感倾向分析的基础工作.提出了一种领域情感词典自动构建方法,并构建了带有情感权重的评教领域情感词典.首先选取情感倾向稳定、情感强度高、词频高的种子词,再使用点互信息PMI计算种子词与候选词的共现程度,作为关联图的权重.最后利用标签传播算法标注候选词的极性,行标准化最后的标签矩阵,将标签矩阵中的概率值作为情感词的强度.尽管PMI可以很好地衡量词之间的紧密程度,但缺少了对复杂句式的处理,将CRM算法的情感标注思想引入到PMI的计算中后,能够使PMI计算结果更加可靠.实验结果表明,该方法在真实评教文本数据集中,能够取得较好的效果.

全文