摘要
静态软件缺陷预测可增强软件系统运行可靠性,针对软件缺陷模块的类别不平衡以及历史数据较少现象,有效结合多核学习技术和集成学习方法,构建基于集成学习的静态软件缺陷预测模型。采用多核学习技术融合不同特征核函数,综合多种核函数优势,获取最好映射性能,提升预测精度;利用集成学习方法的boosting过程,在数据集初始化完成基础上,利用权重更新方法获取各样本对应权重,经多次boosting过程后,得到最终多核集成学习分类器,实现静态软件缺陷预测。实验结果表明:该模型可在绝大部分项目上具备较好的F-measure值和AUC值,预测效果较好;当敏感系数为15,训练集样本数据与测试集杨样本数据比值为2∶1时,该模型预测效果最好。
- 单位