摘要

[目的/意义]在线用户在社交网络分享产品的体验,即便是同种产品的评论,往往包含不同的子话题(产品的不同方面)。面向在线评论的子话题挖掘能够分析参与者对产品的不同方面的关注及需求,为管理者提供更多的决策支持。[方法/过程]现有话题挖掘多采用分类、聚类、概率主题模型的方法,由于描述同一产品的文档往往十分相似,现有方法难以保证子话题的差异性。为此,将概率主题模型融合词共现关系,提出GPLSA方法,包括PLSA算法初步识别子话题、去除公共背景词、合并相似的子话题及更新子话题关键词等步骤。[结果/结论]知乎网站MOOCs数据集上的实验结果表明,GPLSA方法的主题凝聚性高于现有算法,能够有效提高子话题发现的质量。结合MOOCs子话题反馈的学习者需求,给出完善MOOCs管理的有效建议。