摘要

情感分析的一大难点是如何获取主题相关的情感特征信息。首先给出了"有效"情感特征的定义,然后提出了一种基于语义角色标注的有效情感特征抽取方法。该方法先依据评论库的主题元数据得到候选主题特征项,并标注主题句,然后执行主题句的语义角色标注,基于情感特征所在的角色类型判断该特征语义是否指向主题项。该方法的特点在于过滤与指定主题无关的噪声特征。实验面向旅游景区游客评论在不同规模的标注集环境下对比了三种特征抽取方法,即基于词袋的方法、基于主题的方法和文中基于有效情感特征的方法,结果显示文中方法对于短文本的情感分类较词袋方法有3%的性能提升,而对于长文本的情感分类其性能较前面两种方法优势突显,总体达到了84.81%的准确率。