面对数据集的不平衡问题,提出一种改进的少数类过抽样方法 .首先识别少数类样本,然后计算样本和最近的多数类样本的欧几里得距离,从而获得每个少数类样本权重,最后结合聚类方法生成少数类合成样本,以保证合成的少数类样本质量.实验表明,在多个评估度量上,本算法比传统过采样方法在处理不平衡学习问题上更好.