摘要

为解决现有电商水军特征模型对文化产品水军识别不足以及单一分类器识别精度不高的问题,提出面向文化产品水军的多视角特征表达与识别模型。根据文化产品具有丰富的语义性、严格的时效性以及网络交互性等3个特点,从内容、行为、属性3个视角提出了评论主题相似度、平均有用度、行为关联性、兴趣关联性、平均评价积极度和综合质量评价等特征。将这些特征与电商水军识别特征结合,利用特征选择方法去除冗余特征形成表达模型,在多视角基础上运用集成学习算法进行水军识别。实验结果表明,特征表达模型具有很好的区分度,基于多视角的集成学习方法对于文化产品水军识别具有较高的精准率。

全文