摘要
【目的】构建一种微博话题演化方法,正确把握话题发展趋势,提高网络舆情预警能力。【方法】使用Skip-gram模型在文本集上训练得到词向量模型,将每一时间片的微博文本输入BTM得到候选主题,在主题维上构造候选主题词向量;利用K-means算法对主题词向量聚类,得到融合后的主题,进而建立文本集在时间片上的话题演化路径。【结果】实验结果表明,本文方法话题抽取F值为75%,对比主题模型提高约10%,证明本方法的可行性。【局限】话题演化的衡量标准不一致,没有对比多种话题演化方法。【结论】本文方法能有效抽取各阶段话题,为网络舆情分析提供有效途径。
- 单位