摘要
本发明属于数据识别技术领域,公开了一种集成学习中有偏数据下基于多步标签变换的Boosting改进方法,准备训练数据集,测试数据集;针对训练数据集样本原始标签进行有偏性检测和标签变换;采用多阶段标签变换的方式进行Boosting过程迭代,每个阶段训练结束,计算当前阶段下拟合残差,满足变换指标时,进行sigmod压缩变换与boxcox变换;通过及时停止机制确定拟合阶段数目,完成训练过程;通过分阶段对测试数据预测和反变换完成预测过程,得到预测结果。本发明充分缓解了数据有偏性对算法系统带来的影响,提升了算法的灵活性,一定程度上提升了Boosting算法的拟合能力,使得算法表现更加鲁棒。
- 单位