摘要

为了有效地解决不平衡问题,提出一种新颖的基于稀疏邻域和主动学习采样机制的不平衡学习策略。该策略可以克服虚拟样本合成的限制,并且具有降低标记成本的优点。其基本思想是通过对具有较高少数类置信度的未标记样本进行主动采样,标记并添加到不平衡的训练数据集中,从而达到均衡数据集的目的。