摘要

针对块对角表示(block diagonal representation, BDR)子空间聚类算法在对子空间重叠的高维数据聚类时效果较差的问题,提出成对约束的块对角子空间聚类(constrained subspace clustering with block diagonal representation, CBDR)算法,设计主动式学习策略,获取用户提供的少量数据点成对信息,以改进BDR算法的性能,给出CBDR算法的目标函数和求解过程。在测试集上的试验结果表明,CBDR算法的聚类错误率和归一化互信息指标比BDR和SBDR(structured block diagonal representation)算法好,而且主动式选取点对方法优于随机选取点对方法,使用少于5‰的约束信息可降低BDR的聚类错误率达到5%以上。