一种非独立同分布下K-means算法的初始中心优化方法

潘品臣; 姜合<sup>*</sup>; 吕奕锟

摘要

传统聚类算法研究都是在假设数据集的对象、属性等方面满足独立性且服从同一分布的基础上进行的.然而现实中的数据往往是非独立同分布的,即属性之间或多或少都会存在一些交互关系.传统K-means算法随机地选择初始聚类中心,对于中心点的选取比较敏感,容易陷入局部最优且准确率低. Minmax方法针对这一缺点进行了改进,但原始的和改进后的Kmeans算法都忽略了属性之间存在的交互关系.因此本文利用Pearson相关系数公式来计算属性之间的交互关系,并映射于原始数据集.同时利用双领域思想对Minmax方法进行了优化.实验结果表明该方法能够得到较高的准确率、较好的聚类效果以及相对较少的迭代次数.

单位
齐鲁工业大学

收藏分享被引浏览

更新时间：2024-04-10 21:41

一种非独立同分布下K-means算法的初始中心优化方法

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友