摘要

特征选择是机器学习非常重要的预处理步骤,而邻域互信息是一种能直接处理连续型或离散型特征的有效方法。然而基于邻域互信息的特征选择方法一般采用启发式贪婪策略,其特征子集质量难以得到有效的保证。本文基于三支决策的思想,提出了三支邻域互信息特征选择方法(NMI-TWD)。首先通过扩展三个潜在的候选特征子集,并保持各子集之间的差异性,以获得更高质量的特征子集。其次,对三个差异性的特征子集进行集成学习,构建三支协同决策模型,以进一步提高分类学习性能。UCI实验数据表明,新方法的特征选择结果和分类性能较其它方法更优,说明了其有效性。