摘要
话题检测技术可以及时发现网络舆情热点话题和突发性事件,可以持续跟踪话题,实时掌握网络舆情事件的动向。文本聚类算法是实现话题检测与跟踪的重要方法,传统K-Means聚类算法结构简单,收敛速度快,但存在对初始聚类中心选择敏感、容易陷入局部最优解等局限。引入差分进化算法对KMeans算法进行改进,既具有差分进化算法的全局优化能力,又保留了K-Means算法简单高效的优点,并兼顾了网络舆情话题检测的准确性和实时性。实验表明,改进后算法的误检率、漏检率和耗费函数都有明显改善,提高了话题检测准确度上的有效性和实用性。
-
单位山西警察学院