摘要

本发明公开了一种不平衡数据集下基于多数类转化为少数类的分类方法,包括如下步骤:对整体训练数据进行预处理;对每个少数类样在多数类中挑选出一定数量的样本作为伙伴,确定这个数量的取值范围;从多数类中挑选出合适的样本,形成新的样本集合;对集合中样本的标签进行更改;采用新的损失函数对前向加法模型对弱分类器进行提升训练;训练过程中,将最终分类器分布求解,每一步都对目标函数求解最优基分类器和改基分类器的权重;利用分类器进行相关预训练,确定多数类转化为少数类的最终数量。本发明不仅可以应用在图像分类,图像识别,也可以应用在自然语言处理等其他需要分类的场景。