摘要

多视图聚类是无监督学习领域研究热点之一,近年来涌现出许多优秀的多视图聚类工作,但其中大多数方法假设各视图均是完整的,然而真实场景下数据收集过程极其容易发生缺失,造成部分视图不完整。同时,很多方法采取传统机器学习方法(即:浅层模型)对数据进行特征学习,这导致模型难以挖掘高维数据内的复杂信息。针对以上问题,本文提出一种面向不完整多视图聚类的深度互信息最大化方法。首先利用深度自编码器挖掘各视图深层次的隐含特征,并通过最大化潜在表示间的互信息来学习各视图间的一致性知识。然后,对于不完整视图中的缺失数据,利用多视图的公共潜在表示进行补全。此外,本文采用一种自步学习策略(Self-paced Strategy)对网络进行微调,从易到难地学习数据集中的样本,得到更加聚类友好的特征表示。最后,在多个真实数据集上进行实验,验证了本文方法的有效性。