摘要
特征选择是软件缺陷预测中数据预处理的关键步骤。针对现有特征选择方法存在的降维效果不显著、选取的最优特征子集分类精度低等问题,提出了一种基于自适应混合粒子群优化(SHPSO)的软件缺陷预测特征选择方法。首先,结合种群划分设计了基于Q学习的自适应权重更新策略,引入Q学习来根据粒子的状态自适应调整惯性权重。其次,为了平衡算法前期的全局搜索能力和后期的收敛速度,提出了基于曲线自适应的时变学习因子。最后,采用混合位置更新策略来帮助粒子尽快跳出局部最优解,增加粒子的多样性。在12个公开软件缺陷数据集上进行实验验证,与使用全部特征的方法、常用的传统特征选择方法及主流的基于智能优化算法的特征选择方法进行了比较,所提方法在提高软件缺陷预测模型分类性能和降低特征空间维度上均取得有效的结果。其中,与改进樽海鞘群算法(ISSA)相比,SHPSO方法分类精度平均提高约1.60%,特征子集规模平均降低约63.79%。实验结果表明,本文提出的方法可以选出分类精度较高且数量较少的特征子集。
- 单位