摘要
特征选择在数据预处理阶段中极为重要。特征选择的优劣不仅影响着神经网络训练的时间长短,更影响神经网络性能的好坏。灰狼改进花授粉算法(Grey Wolf Improved Flower Pollination Algorithm, GIFPA)是一种基于花授粉算法(Flower Pollination Algorithm, FPA)框架与灰狼优化算法融合的混合算法,将其应用于特征选择问题,既可以保留原始特征的内涵信息,又可以最大化分类特征的准确率。GIFPA算法在花授粉算法的异花授粉阶段中加入了最差个体信息,并用作全局搜索,将灰狼优化算法中的狩猎过程作为局部搜索,并且通过转换系数来调节二者的搜索过程。同时,为了克服群智能算法易陷入局部最优的问题,首次采用数据挖掘领域中的RelifF算法,通过RelifF算法过滤出高权重特征并用于改进最佳个体信息。为了验证算法的性能,实验选取UCI数据库中21个领域的经典数据集进行测试,利用K近邻(KNN)分类器进行分类测评,以适应度值和准确率作为评价标准,并通过K-折交叉验证来克服过拟合问题。实验选择了包括FPA算法在内的多种经典算法和先进算法进行比较,结果表明GIFPA算法在特征选择问题上有很强的竞争力。
- 单位