摘要
光谱聚类(Spectral clustering, SC)由于其在无监督学习中的有效性而受到越来越多的关注。然而,由于其计算复杂度高,不适用于处理大规模数据。近年来,已经提出了许多基于锚点图方法来加速大规模光谱聚类,然而这些方法选取的锚点通常不能很好体现原始数据的信息,从而导致聚类性能下降。为克服这些缺陷,提出了一种二分k-means锚点提取的快速谱聚类算法(Fast spectral clustering algorithm based on anchor point extraction with bisecting k-means , FCAPBK)。首先,该方法利用二分k-means从原始数据中选取一些具有代表性的锚点,接着构建基于锚点的多层无核相似图;然后通过锚点与样本间的相似关系构造层次二部图。最后在5个基准数据集上分别进行实验验证,结果表明,FCAPBK方法能够在较短的时间内获得良好的聚类性能。
- 单位