摘要
信息数据集中存在的冗余、不相关甚至是噪音特征会严重影响管理决策的质量和效率。整合RS理论和ReliefF算法,提出一种"二次过滤"的RRF组合决策方法。首先采用ReliefF算法计算出各个特征权重,过滤掉噪音特征;之后再用启发式的RS方法对原有特征集进行特征约简,过滤掉冗余特征。RRF组合决策方法集合了两个算法的优点,能够有效减少计算的工作量和复杂度,避免RS约简过多以及约简中存在噪音特征等问题,从而起到提高决策质量和效率的作用。最后,用一个真实的医疗信息数据集对算法进行测试,并与两个常见的特征选择算法进行对比,证明本算法在辅助临床决策中的作用。
- 单位