摘要

ReliefF算法通过多次迭代采样样本与同类近邻样本和反类近邻样本,计算出差异系数作为样本属性权值的方式,挑选出权值高的特征,从而完成特征选择任务。但是ReliefF算法从算法本身角度无法去除冗余特征,权值大于分类阈值的特征将会被保留下来。笔者提出一种分阶段的特征提取方法,从横向和纵向两个维度对特征进行选择。仿真结果表明,与ReliefF算法相比,在不影响分类准确率的前提下,去除冗余特征,进一步提高了特征选择的有效性。