摘要

针对多个连续属性离散时较少考虑属性重要性对离散质量的影响,以及离散造成的数据不相容问题,提出了粗糙集理论的自适应连续属性离散算法,算法利用粗糙集正域计算各属性的重要度,按照属性重要度有低到高的顺序对各属性依次进行离散,并在保证信息系统不可分辨关系不变的情况下进行断点的选取。在减少离散点总数的情况下,算法解决了不相容问题和较多地保留了重要属性的特征点。与CAIM离散算法和布尔运算的粗糙集离散算法从离散断点数、算法相容性和算法计算复杂度等几个方面的仿真比较结果表明了所提算法的有效性。

  • 单位
    中国人民解放军陆军工程大学