摘要

针对k-均值(k-means)聚类算法中随机选取初始聚类中心的缺陷,提出了一种新的基于数据样本分布选取初始聚类中心的方法。实验结果表明,改进后的算法能改善其聚类性能,并能取得较高的分类准确率。