摘要

包装器特征选择是一种数据预处理方法,通过筛选出信息量最大的特征来降低原始数据集的维数,同时使分类特征的精度最大化。为提高包装器特征选择能力,提出了一种混合人工化学反应狼群优化算法——ACR-WCA。ACR-WCA算法采用自然策略,模仿狼群的搜索策略,可以快速向解空间靠拢,再采用人工化学反应策略优化狼群的种群行为,快速找到最优解,解决局部最优问题;其次,为有效处理数据特征,在初始化阶段利用转换函数处理成二进制特征问题;之后,结合分类准确率和特征选择数给出算法的适应度函数。同时,采用k最近邻(KNN)分类器对测试数据进行训练,并通过K-折交叉验证来克服过拟合问题。实验基于21个著名的不同维度数据集训练,并与4种传统方法和3种接近方法进行比较。实验结果表明,该算法是高效可靠的,它可以对大量特征进行分类任务,具有较高的准确率。