摘要

为克服软件缺陷预测中的类不平衡问题,提出机器学习模型GA-FSVM。去除软件数据集的冗余特征,使用模糊支持向量机作为分类器,针对软件缺陷预测问题提出相应的模糊隶属度函数,使其能适应数据集的类不平衡,应对数据集中的特异点,使用遗传算法进行参数调优,训练分类器。在NASA数据集上进行交叉验证的结果表明,和几种常见的算法相比,该方法能够提高有缺陷样本的F-measure值。

全文