摘要
随着数据特征维数的增加,如何在少量有标签和大量无标签高维样本的情况下选择相关的特征子集已成为特征选择领域的热点问题.针对现有半监督特征选择算法直接忽略特征选择与局部结构学习之间的相互作用,从而难以有效获取样本分布结构的问题,本文提出了一种基于自适应图学习的半监督特征选择(Semi-supervised Feature Selection with Adaptive Graph learning,SFSAG)算法.利用标签传播将特征空间的稀疏投影学习和近邻图的构建有效地结合起来,实现在选择相关特征的同时还能学习样本的局部结构;自适应地利用样本在投影特征空间中的相似性信息构建可靠的近邻图,从而有效降低噪声特征的干扰并选择更具判别性的特征子集.多种数据集上的实验验证了SFSAG的有效性及其相对于现有半监督特征选择算法的优越性.
- 单位