摘要
属性约简是一种重要的数据降维预处理方法,然而现有的属性约简方法大多没有考虑信息系统中属性权重的信息。ReliefF算法是一种实现简单且运算效率高的属性权重评估方法,本文提出一种随机多属性子空间的ReliefF加权邻域粗糙集和属性约简算法。该方法首先生成了多组具有相同大小随机子空间的属性集划分,并对每组划分的随机子空间利用ReliefF算法计算得到属性的局部权重,将所有组得到的属性局部权重求取平均值,得到了信息系统每个属性最终的全局权重;然后基于属性权重的结果,提出一种新的加权邻域粗糙集模型,并证明了相关理论和性质;最后在该模型的基础上通过加权邻域依赖度提出一种信息系统的属性约简算法。在公开数据集上的属性约简实验结果表明,本文所提出的属性约简算法比已有的同类型算法整体上具有更优的约简性能。
-
单位山西大同大学