摘要

特征选择技术是数据降维的一种关键技术,由于采集到的数据样本标签信息缺失,无监督特征选择受到了更多人的关注。现有的无监督特征选择算法普适性及稳定性很低,受数据集结构的影响很大,因此很多研究者一直热衷于提高算法的稳定性。该文尝试从数据集的预处理出发,采用区间的方式来对数据集进行近似,得到与数据集相关联的几个数据集,通过实验验证新的区间数据集的优劣性,并思考从全局的角度对数据集进行处理,进一步提出了一种新的模型——基于邻域区间扰动融合的无监督特征选择算法框架(Unsupervised feature selection algorithm framework based on neighborhood interval disturbance fusion, NIDF)。该模型可实现对特征的最终得分和近似数据区间的联合学习,通过与原始无监督特征选择方法以及现有的几种特征选择框架的对比,体现出该文提出的模型的优越性。

全文