摘要
大多数研究者对微博倾向性分析过多关注的是情感词、形容词和否定词,忽略了关联词对其情感倾向的影响。为了提高微博情感倾向性分析的准确率,提出了融合关联词的微博倾向性分析方法,考虑微博文本中形容词、程度副词以及关联词之间的组合关系。本文充分考虑了关联词的结构特点并在已有词典的基础上构建专门用于微博倾向性分析的微博词典、否定词词典和关联词词典,同时考虑到网络新词对微博倾向性的影响,还构建了一个全新的网络新词词典。借助支持向量机(Support vector machine,SVM)将微博文本分为负向、正向和中性3类,通过结合情感词典和SVM的方法提高微博文本倾向性分析的准确率。通过对COASE 2014数据实验可以表明,本文方法对微博倾向性分析取得了较好的效果。
- 单位