摘要
聚类是长期存在的重要研究问题,它是一种重要的数据分析技术。然而,传统的聚类方法是在数据空间进行,且聚类数据的维度较高。为了解决这两个问题,提出了一种新的二进制图像聚类框架—基于离散哈希的聚类(CDH)。该框架通过L21范数实现自适应的特征选择,从而降低数据的维度;同时通过哈希方法将数据映射到二进制的汉明空间,随后,在汉明空间对稀疏的二进制矩阵进行低秩矩阵分解,完成图像的快速聚类。最后,使用可以快速收敛的优化方案来对目标函数进行优化求解。在Caltech101、Yale、COIL20、ORL图像数据集上的实验结果表明,该方法可以有效提升聚类效率,节省存储空间。与传统的k-means、谱聚类方法相比,在处理高维度数据时,CDH的时间效率分别提高了约79和58个百分点。
- 单位