摘要

大多数的聚类算法都只是针对数值型数据,而在现实世界中,经常会遇到混合了数值属性和分类属性的数据,因此对混合数据的有效聚类是一个非常有挑战的研究问题。针对混合数据的基于熵的相似矩阵,利用阈值法构造相对应的复杂网络,对生成的复杂网络进行社团结构划分,复杂网络的一种社团结构划分就对应混合数据的一种聚类结果。通过三个实际混合数据集上的测试发现,与混合数据五种聚类算法:DP-MD-FN(density-based clustering algorithm for mixed type data employing fuzzy neighborhood)、K-Prototypes、KL-FCM-GM、EKP(evolutionary K-Prototypes)、OCIL进行比较,实验结果表明利用复杂网络社团结构划分算法得到的混合数据的聚类结果的准确性更高。

  • 单位
    新疆财经大学