摘要
针对子空间聚类在学习聚类的稀疏关系表示时不够精准、聚类误差大的问题,本文提出了使用随机位移和旋转等对原样本进行数据增强的算法。通过交替地使用增强样本来训练和优化网络,并更新样本的集群分配,从而学习稳健的稀疏关系表示;在微调阶段,损失函数中样本的目标都是将原样本分配到集群的中心,正确的分配有利于网络训练,而目标错误的样本会误导网络训练。新模型利用一种无需额外超参数的自适应权重学习,在每次迭代中优先选择易分类的样本,将集群边界附近的样本排除在训练之外,避免难分类样本产生误导性的记忆,从而提高泛化能力。算法在三个标准数据集上进行了实验,与五种典型的聚类算法相比较,证明了所提出算法的性能提升,消融研究和敏感性分析进一步说明了该算法的有效性。
- 单位