摘要

[目的/意义]本研究对正处于演化过程中的话题进行状态识别及趋势预测,为相关部门了解话题现状,对话题进行有效监管提供科学依据。[方法/过程]首先,考虑网民情感,结合话题的新颖度和关注度,构建话题生命周期状态观测指标;其次,基于隐马尔可夫模型(HMM)和高斯混合模型(GMM)的原理,提出话题生命周期状态识别及趋势预测方法;最后,选用微博话题构建数据集,设计对比实验,验证方法的有效性。[结果/结论]基于GMM-HMM的话题状态识别及趋势预测方法的F1值和准确率均高于87%,MAPE低于3.5%,相较于GaussianHMM和BP神经网络具有较大优势。