摘要
随着数据量的增加,分类问题的规模越来越大,导致层次分类产生特征空间高维性和类别空间不一致性问题.基于此,提出一种基于类别一致性的层次特征选择算法.首先,该算法使用递归正则化,为层次类别的每个内部类学习共同特征.其次,充分利用分层结构,将类别相似性约束在输出标签,分析类别间的输出一致性.最后,对样本特征进行稀疏性学习去除无关特征.该算法可以同时处理具有树结构和有向无环图结构的数据.实验结果表明,与5种层次特征选择算法相比,所提算法在线性支持向量机(LSVM)分类器上的评价指标中都取得较好的结果,有效提高分类性能,验证了算法的有效性.
-
单位闽南师范大学