摘要

为了更好地挖掘样本之间的相关性以及更精确地进行特征选择,结合内积正则项与自表示的l2,1范数对无监督特征选择模型进行重构,其中内积正则项可看作l1范数与l2范数的线性组合。使用内积正则项可以同时实现数值结果的稀疏性和低冗余性。传统的特征选择模型假设特征之间是独立的,而自表示模型假设特征之间是线性相关的,从而能够更好地挖掘数据样本之间的关系。针对新建立的无监督特征选择模型,通过设计的拉格朗日乘子法进行优化模型求解,使用国际标准数据集对无监督特征选择模型进行实验验证,并求出聚类得到的准确率和标准互信息的值,同时也选取了3种传统无监督特征选择算法进行对比实验,验证了该算法的可行性和有效性。