摘要

在实际应用领域中,存在许多特征空间无法预先给定的场景,数据以特征流的形式随时间动态流入特征空间,而样本数量是固定不变的.同时,数据的类别中往往存在丰富的层次化结构关系,传统的特征选择算法在性能上已无法满足需求.基于此,本文提出一种面向层次分类学习的在线流特征选择算法.首先,利用兄弟节点之间的关系设计了一种基于最大近邻的决策误差率计算公式.其次,设计在线重要性选择和在线冗余更新两种在线评估准则,用于选择决策误差最小的特征子集.最后,在6个层次数据集上的实验结果表明,所提算法优于一些现有的在线流特征选择算法.

  • 单位
    闽南师范大学