摘要

现有k-modes聚类方法,因忽略了变量属性之间的弱相关性,常造成其在实际应用中聚类性能不佳。为此本文提出一种包含属性弱相关性的新k-modes聚类方法。首先引入最大信息系数(MIC)度量数据集中变量属性之间的相关性;其次,将得到的MIC值与原有距离进行融合,建立包含属性弱相关性信息的新度量方法,以增强变量属性间相关信息的完备性,进而建立更加精细的k-modes聚类方法;最后调用三种不同的数据集,将新方法与原有的k-modes聚类方法和其他改进k-modes聚类方法的性能进行对比,并用仿真分析了新方法的性能与计算复杂度。