摘要

K-means聚类高度敏感的初始化聚类中心选取一直是个难题。K值的选取能影响到实验结果。本文改进K-means聚类中心的初始化方法。首先,使用多个具有随机初始化的K均值聚类器构建一组基本聚类。然后,基于密度的思想,排除干扰的孤立点构建和聚集聚类来构建预聚类结果。获得初始的聚类中心集,然后将其用于最终K值聚类过程。最后证明了改进后方法的优越性。