摘要

非负Tensor-Train分解作为一种重要的张量分解模型,可以保留数据的内部结构信息,广泛应用于高维数据的特征提取和表示。另一方面,从流形学习的角度看,高维数据中的信息通常潜在于一个低维空间中的非线性流形结构上。然而,现有的图学习理论只能建模对象间的成对关系,对于具有复杂流形结构的高维数据,并不能准确刻画其相似关系。为此,文中引入超图学习,提出了一种超图正则化非负Tensor-Train分解方法(HGNTT)。该方法在从高维数据中提取低维表示的同时,通过构建超图来描述样本数据间的高阶关系,从而保留其非线性流形结构。此外,基于乘法更新方法,本文设计了一种有效的算法来对所提模型进行优化求解,并通过实验表明新算法是收敛的。在ORL和Faces95两个公开数据集上进行聚类任务的实验结果显示,相比于K-means、NMF、GNMF、HNMF、HGNTD,NTT和GNTT等方法,新方法在聚类准确率上提升了1.2%~8.6%,在归一化互信息上提升了0.2%~3%,验证了所提方法的有效性。

全文