类不平衡数据的卡方聚类算法研究

刘欢; 胡德敏

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

类不平衡数据的卡方聚类算法研究

作者：刘欢; 胡德敏

来源：软件, 2019, 40(04): 7-10.

摘要

K-means型算法在处理类不平衡数据时趋向于形成大小相同的簇,是"均匀效应"。针对这一问题诸多研究者提出了不同的聚类算法,这些方法针对簇样本数量不平衡特性,存在精度和效率问题。本文以卡方距离为基础提出了一种类平衡数据的聚类算法,利用均值消除受簇均值水平影响的特性度量样本相似性,解决类不平衡数据中"均匀效应"问题,给出了聚类目标函数,形成一种EM型聚类优化算法。在UCI实际数据集上进行了实验,结果表明本文所提出的算法提高了类不平衡数据的聚类精度,降低了"均匀效应"对聚类结果的影响。

单位
上海理工大学

收藏分享被引浏览

更新时间：2024-04-09 22:19

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号