一种改进的K-Means聚类算法

作者:刘文佳; 张骏
来源:现代商贸工业, 2018, 39(19): 196-198.
DOI:10.19311/j.cnki.1672-3198.2018.19.086

摘要

传统的K-means聚类算法采取随机原则选取初始聚类中心,使得聚类结果不稳定;且随着数量的不断增加,时间复杂度也不断增长。针对以上问题,采取最大距离的原则,取距离尽可能大的对象作为初始聚类中心,避免K-means算法在选取初始聚类中心时,可能出现的聚类中心过于邻近,使得各类别的差异不显著的情况。借用三角不等式原理,即任意两边之和大于第三边,来优化各样本点与聚类中心的计算,减少了一些不必要的距离计算和比较。实验结果表明,改进的K-means算法较传统的K-means算法而言,聚类结果具有较好地稳定性,且拥有更高的运算效率,时间复杂度更低。

全文