摘要

现有的多视角谱聚类算法大多只线性结合了各视角的基拉普拉斯矩阵,忽略了不同视角数据的差异性对最优拉普拉斯矩阵的影响,存在聚类性能受限的问题。提出了一种基于黎曼几何均值与高阶拉普拉斯矩阵的谱聚类算法(RMMSC)来解决该问题,挖掘了多视角数据中的高阶连接信息与流形信息,同时提高了最优拉普拉斯矩阵对各视角的信息利用率。首先,按一定的权重线性结合了数据单一视角的各阶拉普拉斯矩阵,得到每个视角的基拉普拉斯矩阵。低阶与高阶连接信息的结合使用充分体现了多视角数据集的全局结构。然后,计算各视角基拉普拉斯矩阵的黎曼几何均值,将其作为最优拉普拉斯矩阵。相比于传统的矩阵算数均值的计算,基于黎曼流形的黎曼几何均值更好的恢复了互补层数据的流形信息。最后,将该最优拉普拉斯矩阵作为谱聚类算法的输入进行聚类,得到最终的集成结果。实验结果表明,RMMSC在多组标准数据集上显示出了优于已有算法ONMSC, MLAN,AMGL等的聚类效果。其中,在Flower17数据集上,精确度较基准模型ONMSC提高了2.14%,纯度提高了1.7%。且收敛性较好,具有较好的性能。

全文