改进SMOTE的非平衡数据集分类算法研究

赵清华; 张艺豪; 马建芬; 段倩倩

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

改进SMOTE的非平衡数据集分类算法研究

作者：赵清华; 张艺豪; 马建芬; 段倩倩

来源：计算机工程与应用, 2018, 54(18): 168-173.

摘要

针对随机森林和SMOTE组合算法在处理不平衡数据集上存在数据集边缘化分布以及计算复杂度大等问题,提出了基于SMOTE的改进算法TSMOTE(triangle SMOTE)和MDSMOTE(Max Distance SMOTE),其核心思想是将新样本的产生限制在一定区域,使得样本集分布趋于中心化,用更少的正类样本点人为构造样本,从而达到限制样本区域、降低算法复杂度的目的。在6种不平衡数据集上的大量实验表明,改进算法与传统算法相比,算法消耗时间大幅减少,取得更高的G-mean值、F-value值和AUC值。

单位
太原理工大学

收藏分享被引浏览

更新时间：2024-04-24 13:41

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号