摘要
邻域粗糙集,采用半径的方式度量样本之间是否相似,因而不同大小的半径自然地构成了不同尺度意义下的粗糙近似。基于邻域粗糙集的属性约简问题往往需要在多个不同半径上求解约简,其目的是找到具有较好泛化性能的属性子集,或探讨不同尺度意义下约简性能的变化趋势。但值得注意的是,利用传统的启发式算法在多个半径所对应的多尺度意义下进行约简求解时,往往需要在所有尺度上逐一重复执行这一算法,时间消耗较大,特别是尺度个数较多的情况下,时间消耗会变得更高。为解决这一问题,借助半径的变化,文中提出了面向多尺度的约简求解加速策略。这一策略在分别考虑半径从小到大和从大到小的变化趋势的情况下,同时缩小了样本和属性的遍历规模,将当前半径下约简的求解过程建立在上一个半径所求得约简的基础上,利用启发式搜索进行正向或逆向的属性增加及删除操作。为验证所提加速策略的有效性,实验选取8个UCI数据集,采用十折交叉验证的方法求取20个半径下的约简,对比不同方法求解约简的时间消耗和分类性能。实验结果表明,与利用传统的启发式算法在每一个尺度意义下单独求解约简的方法相比较,文中所提出的正向或逆向加速搜索方法可以在保持分类性能不发生显著变化的情况下,极大地降低多尺度意义下求解约简的时间消耗,并且有效地降低过拟合的程度。
- 单位