摘要

在机器学习领域,超参数是影响模型性能的关键因素之一。已有研究表明,超参数优化能够显著提升版本内缺陷预测和跨项目缺陷预测性能,而对跨版本缺陷预测性能的影响尚不明确。选取五种经典缺陷预测模型(决策树、K-近邻、随机森林、支持向量机和多层感知机)以及四种常用超参数优化算法(基于TPE的贝叶斯优化、基于SMAC的贝叶斯优化、随机搜索和模拟退火),在PROMISE数据集上进行实验,探究超参数优化对跨版本缺陷预测性能的影响。研究结果表明:决策树、K-近邻和多层感知机模型超参数优化后,跨版本缺陷预测AUC值得到显著提升;超参数优化后的模型仍保持与默认超参数设置下相当的稳定性;除了较为复杂的多层感知机模型,其余模型超参数优化的时间平均为1~2 min,在跨版本缺陷预测实验中优化模型超参数是可行的。上述结果表明,跨版本缺陷预测应考虑优化模型超参数以提升预测性能。