摘要
为了实现特征空间降维,提高文本聚类准确性,提出一种融入混沌与对立学习的二进制粒子群优化特征选择算法。设计了新的词条权重计算方法,将文本数据表达为矢量空间模型;提出改进二进制粒子群算法求解特征选择问题,引入混沌系统和对立学习机制对粒子随机搜索方向和初始种群分布分别进行优化;在评估粒子适应度中引入词条方差和平均中位数两种方法对特征子集评估,并设计特征合并和交叉机制融合两种适应度的优势,生成最优特征子集;利用K均值算法对特征选择的文本进行聚类。结果表明,该算法在特征降维、聚类准确率、F度量值上均优于同类算法,可以有效实现特征空间降维并提升文本聚类性能。
-
单位重庆轻工职业学院; 青岛理工大学