摘要

提出了基于样本相关性的层次特征选择算法(hierarchical feature selection algorithm based on instance correlations,HFSIC)以进一步提高分层分类特征选择算法的性能。在使用稀疏正则项去除不相关特征之后,将层次结构中的父子关系与特征空间中样本之间的重构关系相结合,学习同一子树下各类别的样本相关性,利用递归正则优化输出特征权重矩阵。在衡量样本相关性时,将重构系数矩阵整合到训练模型中,同时利用l2,1范数去除不相关的和冗余的特征。使用加速近端梯度法解决所提模型的优化问题,并在多个评价指标下评估所提算法的优越性。试验结果表明,所提方法在5个数据集上的表现优于其他算法,验证了该算法的有效性。

  • 单位
    闽南师范大学