摘要
当前的数据挖掘和机器学习技术面临着大样本、高维度数据的挑战,使用特征选择方法作为重要的降维手段得到了极大的关注.然而,许多过滤式特征选择方法仅使用一种相关性度量去除冗余特征和不相关特征,并且没有考虑特征之间的交互性.因此,提出基于多种相关性度量的过滤式特征选择算法,另外,本文提出的算法也考虑了特征之间的交互性.该算法将转化为0-1标准形式的两种相关性度量进行融合,同时引入待选特征与已选特征的补充相关性因子解决特征之间的交互性.基于8个UCI数据集和3个常用分类器的实验验证了本文算法的有效性,同时与五种典型的过滤式特征选择方法相比,本文所提出的方法获得了更好的分类结果.
- 单位