摘要

通用情感词典(GPEL)对情感词语所在上下文的背景建模方面表现较差。针对此问题,提出一种领域特定情感词典(Domain Specific Emotion Dictionary, DSED)生成方法的扩展方法。所提方法在特征提取中使用了DSED提供的知识,而非简单的词语计数。利用在训练文档上学习到的DSED知识,提取出基于词典的特征。词性标注、情绪词典和GPEL作为提取情感分类相关特征的外部资源。实验在SemEval-2007、微博数据集和博客数据集三个公开数据集上进行,实验结果表明,所提方法提取出的特征显著优于从GPEL提取出的特征,与逐点互信息(PMI)、n元语法等方法相比,所提方法的性能更优。

  • 单位
    济宁学院