高度不平衡数据的代价敏感随机森林分类算法

平瑞; 周水生<sup>*</sup>; 李冬

doi:10.16451/j.cnki.issn1003-6059.202003006

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

高度不平衡数据的代价敏感随机森林分类算法

作者：平瑞; 周水生^*; 李冬

来源：模式识别与人工智能, 2020, 33(03): 249-257.

DOI：10.16451/j.cnki.issn1003-6059.202003006

摘要

在处理高度不平衡数据时,代价敏感随机森林算法存在自助法采样导致小类样本学习不充分、大类样本占比较大、容易削弱代价敏感机制等问题.文中通过对大类样本聚类后,多次采用弱平衡准则对每个集群进行降采样,使选择的大类样本与原训练集的小类样本融合生成多个新的不平衡数据集,用于代价敏感决策树的训练.由此提出基于聚类的弱平衡代价敏感随机森林算法,不仅使小类样本得到充分学习,同时通过降低大类样本数量,保证代价敏感机制受其影响较小.实验表明,文中算法在处理高度不平衡数据集时性能较优.

单位
西安电子科技大学

全文

访问全文

收藏分享被引(40) 浏览

更新时间：2024-04-13 19:36

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号