摘要
低维数据样本集中不同类别数据在属性空间中存在混叠现象,无法对类别数据进行有效的表征,导致分类识别效果不理想.从原始数据空间的本征结构出发,提出一种基于叉积变换和CH指标相结合的叉积约束变换方法.对比于传统的空间优化方法,叉积约束变换方法基于属性间的强相关表征次团结构的紧密性,对强相关属性利用叉积变换实现数据高维空间优化,增加强相关属性的非线性协相关信息;并基于类别数据空间邻接结构特征,利用CH指标定义增维约束条件,减少无约束数据增维带来的冗余.以部分UCI数据集(Bupa、Seeds、Tae)和测井岩性数据为例进行测试,实践表明:该方法在保留原始数据属性空间结构信息的基础上,优化了数据在高维属性空间的结构,增强了类别数据的可分性.对比于传统的空间结构优化方法,实现了测试数据分类识别精度的提高.
-
单位中国地质大学(北京); 数理学院