摘要

比较是在线评论中较为常见的一种评价形式,从海量的在线评论中识别出包含比较关系的评论,并将这些比较关系可视化是文本挖掘的研究热点。本文提出一种根据比较句的次范畴判别语料类型的比较句识别方法,采用规则与统计相结合的方法,将人工模式库与CSR方法相结合,构造了比较句混合规则库,在此基础上进行比较实体名的二次识别,实现了比较句的准确识别和类型判别。以大众点评网的餐馆评论作为实验语料,结果表明,在保证召回率的同时,该方法能有效地提高比较句识别的准确率。在此基础上对产品特征以及比较观点进行了挖掘和情感计算,实现了可视化的餐馆竞争力分析。