摘要

针对情感词汇语义关系抽取缺乏问题,提出一种简单有效地利用网络知识百科抽取情感词汇语义关系的方法。情感语义关系抽取采用的是递归算法,选用网络百度百科数据源为百度汉语,抽取内容包括情感词汇、情感词汇的同义词和反义词两种情感语义关系。其次,利用抽取出的情感词汇语义关系和现有倾向词典自动扩展标注情感词汇的情感倾向。该方法有效地构建了中文情感词汇语义关系,抽取结果和现有情感词典相比提高了情感词汇数量。同时,基于现有情感词典和抽取的情感词汇间语义关系,实现了快速地扩展情感词语的倾向标注。实验结果表明,抽取获得了2万多个中文情感词汇及其语义关系,并通过情感词汇语义关系实现对抽取词汇的情感倾向扩展标注,准确率达到78.1%。

全文