摘要

情感特征的稀疏性和标注语料的规模受限是影响情感分析方法准确性和推广能力的两个重要难点。区别于基于共现或者句法信息的向量抽取方法 ,定义了一种基于语义角色的情感特征向量,该向量所含特征与预设主题具有真实的语义相关性,同时实现了一种基于规则的向量抽取方法。在基础上,将该向量引入基于图的半监督学习模型,提出了基于有效角色向量的文本相似度度量方式。实验基于在线旅游评论库对比评估了本文的半监督学习模型与传统的监督学习模型以及三种相似度计算方式,结果显示在小规模标注语料上获取了较大的性能提升。