摘要

针对传统的聚类算法对初始聚类中心敏感度低、全局搜索能力差的问题,提出了一种改进的K-means聚类算法。以动态性数据情报侦查的数据源为逻辑起点,采用人工分析先验知识,建立案件侦查的同义词转换表,根据指标权重值缩减词项规模,以相似度最小的点为初始聚类中心,以适应度最小粒子位置为全局最优解,基于最近邻法则进行聚类划分,对数据对象划分。实验结果表明:文中提出的改进K-means算法在数据分类准确率、召回率、F-score方面都有了很大程度的提高,但算法纯度指标方面改进并不明显。