摘要
在传统基于图表示的聚类算法中,表示矩阵计算和聚类通常分开进行,导致最后获取的表示矩阵可能不能代表最优的聚类结构.为解决此问题,本文提出一种新的聚类模型,它能在学习数据表示矩阵的同时获取合适的聚类结构.首先,基于局部距离度量,通过为每个数据点自适应地分配最优近邻学习数据表示矩阵.然后,通过在模型中施加约束项,降低噪声和离群点的影响,学习更优的表示矩阵.最后,对已学习到的数据表示矩阵的拉普拉斯矩阵施加秩约束,使得最终学习到的表示矩阵中的连通分量个数与簇个数相同,得到能够表征聚类结构的表示矩阵.实验将所提出的方法与11个算法在7个数据集上进行了比较,结果验证了该算法的有效性.
- 单位