摘要
高维特征数据包含大量的无关信息和冗余信息,这些信息可能会极大降低学习算法的效率。对于加速机器学习算法,提升学习模型泛化能力和避免维数灾难的影响,特征选择算法在很多应用场景下扮演重要角色。在数据特征空间未知,动态变化的场景下,传统的基于静态特征空间场景的特征选择算法因效率低而不适用。为解决特征空间动态未知的流特征场景下的特征选择问题,提出基于?2,1范数的在线流特征选择算法。利用?2,1范数的行稀疏性质和噪声不敏感的特性实现特征选择模型的构建。实验表明,在多个高维数据集上,新提出的流特征选择算法相比较其他的流特征选择算法具有较高的分类识别率和稳定性。
- 单位