摘要

本发明提出了一种基于融合Boost模型的不平衡数据采样方法,具体实现步骤如下:(1)生成训练样本集;(2)训练提升Boost模型;(3)定义pure1、danger1、noise1数据集;(4)获取训练样本集的样本点在加权特征空间的位置关系;(5)定义danger2、pure2、noise2数据集;(6)融合数据集;(7)合成新样本点;(8)获得平衡数据样本集。本发明采用融合Boost模型的不平衡数据采样方法,能够结合模型认知数据信息和特征空间数据分布信息,在平衡数据同时去除冗余数据,同时保护了数据原有特征结构,有效提高数据性能。