摘要

虚假评论识别对于用户生成内容的知识获取和利用至关重要,然而,缺少真实可靠的虚假评论数据集使基于机器学习的虚假评论识别具有极大的难度.针对此,考虑采用有标记的黄金数据集以及无标记的亚马逊评论数据集辅助研究跨域虚假评论识别方法 .首先,考虑数据集的分布异构特性,提出KMM(Kotlin Multiplatform Mobile)迁移学习策略来有效地获取具有虚假评论的文本共性特征,实现评论文本的跨域迁移;然后,在目标域集合中利用协同半监督机制,基于迁移数据和目标域自身少量标记评论来实现对无标记评论的虚假性识别.迁移学习与协同半监督共生融合,即利用不断更新的目标域标记评论样本,动态多批次实现跨域评论文本的迁移,并完善协同半监督机制,以逐步提高目标域对虚假评论文本的识别精度.在典型亚马逊服装评论数据集和Yelp酒店评论数据集上的实验,证明了提出方法的有效性.