摘要
回归学习是用于对具有实值标记样本进行学习建模的监督学习技术.为获得良好的预测性能,通常需要大量的训练样本,然而,在实际应用中可收集到的训练样本数量极少.针对该问题,提出一种基于二次学习框架的新型二次回归学习方法——基于神经网络集成的回归树算法(NERT).该方法借助虚拟样本生成技术,通过串行执行的两个学习阶段对其进行有效利用,有效缓解训练样本不足的困难,从而提升学习性能.同时,通过为两个阶段分别选择泛化能力强和理解性好的学习方法,可得到预测性能好且可理解性高的模型.实验结果表明在训练样本极少的软件开发工作量预测问题上,NERT方法能够从小样本数据得到比现有方法更好的预测性能,同时其模型内在可理解性能够揭示工作量预测的关键因素.
-
单位计算机软件新技术国家重点实验室; 南京大学