摘要

为提高邻域粗糙集属性约简算法的运行效率,降低属性约简算法的复杂度,提出一种基于k近邻属性重要度的约简算法。通过计算某属性下距离样本点最近的k个同类和k个异类样本点的距离得到一种属性重要度的评价指标,融入相关系数方法去除约简属性的冗余信息。通过在多个UCI数据集上进行验证,实验结果表明,与现有算法相比,该算法能更快速判断出数据集中各属性的重要度,有效降低了约简算法的时间复杂度,能更快速得到约简属性,获得较高的分类精度。

全文