多类类别不平衡学习算法:EasyEnsemble.M

作者:李倩倩; 刘胥影
来源:模式识别与人工智能, 2014, 27(02): 187-192.
DOI:10.16451/j.cnki.issn1003-6059.2014.02.013

摘要

随机欠采样方法忽略潜在有用的大类样本信息,在面对多类分类问题时更为突出.文中提出多类类别不平衡学习算法:EasyEnsemble.M.该算法通过多次针对大类样本随机采样,充分利用被随机欠采样方法忽略的潜在有用的大类样本,学习多个子分类器,利用混合的集成技术最终得到性能较优的强分类器.实验结果表明,与常用的多类类别不平衡学习算法相比,EasyEnsemble.M可有效提高分类器的G-mean值.

全文