摘要

针对现有重采样技术中不平衡度量的缺陷,文章提出了一种基于模糊代表度的重采样方法(FRDR)。首先根据近邻传播算法找出代表性样本;然后利用马氏距离定义模糊相似度,分别计算每个样本的模糊代表度,并删去模糊代表度较低的样本,选取模糊代表度符合标准的正类样本进行过采样,直到模糊代表度差满足条件;最后,将传统的过采样方法与所提出的方法进行比较,结果表明该方法更具优越性。

全文