快速求解粒球粗糙集约简的属性划分方法

作者:巴婧; 陈妍; 杨习贝*
来源:南京理工大学学报, 2021, 45(04): 394-400.
DOI:10.14177/j.cnki.32-1397n.2021.45.04.002

摘要

传统邻域粗糙集需指定半径或通过搜索方式找出适用于问题求解的半径,这在数据预处理过程中会带来极大的时间消耗。而粒球粗糙集方法则能够依据数据分布,自适应地生成合适的粒结构。以粒球的纯度为度量准则,粒球粗糙集方法亦为属性约简问题的研究引入新的思路。利用前向贪心搜索求解约简时,需尝试计算每一个候选属性被加入约简池后所引起的粒球纯度的变化,这为算法的执行效率带来了严峻挑战。为解决这一问题,在前向贪心搜索进程中提出了属性划分策略,其本质是将所有属性划分成不同的组,从而能够压缩候选属性的搜索空间,以达到快速求解约简的目的。使用了10组UCI数据集,最终的实验结果说明,相较于传统邻域粗糙集约简以及基于纯度的粒球粗糙集约简,引入属性划分策略后,能够极大地提升粒球粗糙集约简求解的时间效率。

全文