摘要
软件缺陷预测是提高软件测试效率和保证软件可靠性的重要途径。为了提高软件缺陷预测模型的性能,文中提出一种集成随机属性的朴素贝叶斯算法。该算法通过随机属性子集与若干个朴素贝叶斯基分类器结合后进行集成,实现对软件数据的缺陷预测。首先,构造随机属性子集并将随机属性子集与基模型进行匹配并训练;其次,使用验证集对基模型逐一验证,删除正确率低于随机概率的基模型;最后,将正确率大于随机概率的基模型进行集成,得到最终分类模型。通过使用NASA软件缺陷预测公开数据集进行实验,并与5种常用软件缺陷预测算法进行对比,结果表明,该算法预测率与误报率保持较优的情况下综合评价指标AUC提升0.126。因此,该算法在预测率和误报率保持相对稳定的同时,对缺陷模块的分类效果有大幅提升,具有一定实用价值。
- 单位