摘要

随着电商平台的发展,产生了大量的评论信息,从海量的非结构化的在线评论文本中获取有价值的评论信息,难度很大。为了后期更高效地进行中文观点挖掘和情感分析并提高评价信息抽取的准确率,针对已有的评价信息抽取方法存在缺乏语义联系的问题,提出了将条件随机场模型与语义分析结合的方式抽取评价信息。首先,对京东商城的评论数据进行采集、清洗,将清洗后的评论数据进行句法分析、语义分析等预处理;然后,使用TF-IDF算法确定评论数据集中用户的关注度,来半自动标注数据集;最后,在条件随机场模型中引入依存句法、语义依存等特征抽取评价对象和评价词。实验结果表明,该方法在抽取评价信息上具有较高的准确率和召回率,同时验证了抽取评价信息中语义关系的重要性。

  • 单位
    内江师范学院