摘要
图拉普拉斯嵌入(graph Laplacian embedding,GLE)作为传统的无监督降维方法在处理非线性流行数据上有着广泛的应用,但是它忽视了数据本身所携带的有限的弱监督信息,同时仅学习样本空间的结构,无法有效区分具有高度相似的不同类簇的样本。鉴于此,提出了一种差异性传播引导块稀疏正则的图拉普拉斯嵌入(dissimilarity propagation-guided block sparse GLE,DPBS-GLE)方法。首先,引入约束谱正则聚类(constrained clustering via spectral regularization,CCSR)模型,结合弱监督信息生成的成对约束,将原样本映射到高维的类判别空间,增强类簇之间的差异性;然后,通过图正则化方式,获取高维空间的邻接结构;最后,使用样本的“勿连”约束构造不相似矩阵引导一个稀疏正则项,用来增强数据低维嵌入的块对角表示能力,进而提高样本间的差异性。提出的算法与其他5个对比算法在6个标准数据集上进行比较,实验结果表明,提出的算法具有更高的聚类性能。
- 单位