摘要
如何对多视图无标签数据进行特征选择已经成为数据挖掘领域中的一个重要问题。现有的多视图无监督特征选择方法大多存在以下问题:样本间的相似度矩阵、不同视图的权重矩阵和特征的权重矩阵往往是预先定义的,不能有效刻画数据间的真实结构以及反映不同视图和特征的重要性,进而导致不能选出有用的特征。为了解决上述问题,本文首先在多视图模糊C均值聚类的基础上进行视图权重和特征权重自适应学习,以实现特征选择和同时保证聚类性能;然后在拉普拉斯秩约束下自适应地学习样本相似度矩阵,进而构建了基于自适应学习的多视图无监督特征选择(ALMUFS)方法;最后设计了一种交替迭代优化算法对目标函数进行求解,并在8个真实数据集上与6种无监督特征选择基线方法进行比较。实验结果表明,ALMUFS的ACC和F-measure优于其他方法,与自适应协作相似性学习(Adaptive Collaborative Similarity Learning, ACSL)、ASVM等次优方法相比分别平均提升了5%和7%,验证了所提方法的可行性和有效性。
- 单位