摘要
为了提高不完备信息系统中的属性约简能力,文中基于容差关系研究了知识粒度、知识依赖度等概念,给出了一种新的知识粒度定义,研究了两种依赖度的性质,并通过例子加以验证.通过引入知识粒度的概念,对信息系统中属性的重要度进行了定义;并以属性重要度作为启发式信息提出了属性约简的两种算法,一个从核属性集出发,采用自底向上的方法,另一个从整个属性集出发,采用自顶向下的方法.在5组UCI数据集上的实验结果表明,从约简个数来看,文中算法与其他算法相比,属性个数少于或等于其他算法结果;从分类精度来看,从核属性集出发的算法精度更高.最后通过实验验证了文中算法的正确性和可行性.
- 单位