摘要
模糊粗糙集理论目前在数据挖掘和机器学习等领域受到了广泛的关注. 它提供了一种能克服离散化问题的有效工具,并能直接应用于数值或混合属性数据. 在模糊粗糙集模型中,定义模糊关系来测量对象之间的相似性,数值属性值不再需要离散化. 它已经被成功应用于许多领域,如属性约简、规则提取、聚类分析和离群点检测. 信息熵被引入到模糊粗糙集理论进行模糊和不确定信息的表示,产生了不同形式的模糊不确定性度量,如模糊信息熵、模糊补熵和模糊互信息等. 然而,大部分所提关于决策的模糊互信息都是非单调的,这可能导致一个不收敛的学习算法. 为此,基于混杂核模糊补熵,定义了关于决策的模糊补互信息,证明了其随特征呈单调性变化. 进而,利用混杂核模糊补互信息探索特征选择方法并且设计了相关的算法. 实验结果展示了在大多数情况下所提算法可以选取更少的特征且能保持或提高分类准确率.
- 单位