摘要
基于不完整数据的多视图聚类任务已经成为无监督学习领域的研究热点之一。然而大多数基于“浅层”模型的多视图聚类算法往往在面对大规模高维数据时难以提取和刻画视图内的潜在特征结构;并且堆叠或求平均的多视图信息融合方式忽视了视图之间的差异性,没有充分考虑各视图对构建公共一致表示的贡献不同。针对以上问题,提出一种基于自注意力融合的不完整多视图聚类算法(IMVCSAF)。首先,基于深度自编码器提取各视图的潜在特征,同时采用对比学习的方式最大化各视图间的一致性信息;其次,采用自注意力机制对各视图的潜在表示进行重新编码和融合,并全面考虑和挖掘不同视图之间的内在因果性和特征互补性;再次,基于公共一致表示对缺失实例样本的潜在表示进行预测和恢复,从而完整地实现多视图聚类的过程;最后,在4个数据集上进行对比实验。实验结果表明,IMVCSAF在满足收敛性要求的前提下得到的实验精度均高于其他对比算法,在50%缺失率的Noisy-MNIST数据集上IMVCSAF的准确率比次优的COMPLETER(inCOMPlete muLtiview clustEring via conTrastivE pRediction)算法提高了6.58个百分点。
- 单位