针对处理大样本数据时聚类算法的局限性,以及k-means算法受初始聚类中心和异常数据的限制,聚类结果不稳定的问题,本文提出了基于差分进化的加权k-means算法,优先选择初始聚类中心,采用差分进化算法,根据样本对聚类分析影响程度不同,设计加权欧氏距离,来减少异常点带来的不利影响,从而获得稳定的聚类结果。实验结果表明,该算法选择的初始聚类中心更接近最终聚类中心,提高了算法的计算效率。