摘要
针对传统虚拟仪器软件预测模型易产生偏向无缺陷类别结果,导致出现缺陷预测性能较低的问题,提出基于机器学习的虚拟仪器软件缺陷预测模型。利用邻域清除算法进行数据预处理,消除重叠非缺陷样本,通过随机采样的方式,划分平衡训练集,使用朴素贝叶斯NB算法将训练集映射给定测试样本集中进行软件缺陷预测,得到多个缺陷预测子集,利用机器学习集成得到最终软件缺陷预测模型,完成基于机器学习的虚拟仪器软件缺陷预测模型构建。对比实验结果显示,设计软件缺陷预测模型在不同标记比例的9个程度不同不平衡数据集上,平均赢得的数据集数目为7.67,AUC值均较传统缺陷预测模型有较明显地提高,表明设计软件缺陷预测模型在不同软件数据集上有良好预测效果,为实际虚拟仪器软件缺陷预测提供了新思路。
-
单位贵州电网有限责任公司