摘要
结合时间序列与多尺度特征,提出一种改进的虚假评论识别方法。考虑时间因素对评分及其分布的影响,构建基于多维时间序列的虚假评论识别模型提取异常评论特征,并对异常评论特征进行层次划分,根据多尺度特征思想获取基准尺度特征及细分尺度特征。采用基于密度峰值的聚类算法识别虚假评论,并提高虚假评论识别模型的抗噪能力。实验结果表明,与基于基准尺度特征和多尺度特征的密度峰值聚类虚假评论识别方法相比,该方法的AUC值达到92%,虚假评论识别正确率更高。
-
单位山东师范大学; 生命科学学院; 计算机软件新技术国家重点实验室