基于聚类分析的网络舆情主题提取

作者:程小刚; 安梦佳; 郭韧
来源:计算机时代, 2020, (05): 30-37.
DOI:10.16644/j.cnki.cn33-1094/tp.2020.05.009

摘要

网络舆情具有时效性强、传播迅速、涉及方面杂而广、意见指向性特征明显、泛娱化特征明显等特点。因此,提出对LDA输入数据采用TF-IDF算法加强特征词筛选的方法。选取"巴黎圣母院大火"事件,采集作为网络舆情重要来源的微博数据,进行LDA建模,引入TF-IDF算法进行特征词的筛选,能较准确地分析出该事件的主题分布。