摘要

图聚类是图挖掘研究领域目前的研究热点之一。现有基于非深度学习技术的多个中小规模图的聚类算法提取频繁子图并作为特征,主要存在所选特征无效或重要特征丢失的问题,影响了聚类的性能。因此,本文提出了一种基于混合特征选择的图聚类算法。首先提出了一种基于主成分分析原理(Principal Component Analysis, PCA)的评估函数,从图数据集中挖掘出区分特征子图,作为候选特征。其次,提出了一种分支定界技术,加速了区分子图的挖掘过程。接着,为了进一步提高聚类准确率,不失一般性地选择了一种流行的嵌入式特征选择算法,继续对候选特征集进行特性选择,并同时完成图聚类。最后,通过真实数据集上的实验验证了本文提出的基于混合特征选择的图聚类方法的有效性。