一种改进密度峰值聚类的欠采样算法

李鑫

doi:10.19850/j.cnki.2096-4706.2022.18.019

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

一种改进密度峰值聚类的欠采样算法

作者：李鑫

来源：现代信息科技, 2022, 6(18): 81-88.

DOI：10.19850/j.cnki.2096-4706.2022.18.019

摘要

不平衡数据越来越多地出现在各个领域，而传统机器学习分类算法往往会忽略少数类样本的分类精度，针对此问题，提出一种基于密度峰值聚类改进的欠采样算法。该算法利用信息熵对密度峰值聚类算法进行优化，获取最优截断距离；选取密度距离较大的点作为聚类中心并选取所有聚类中心代表整个多数类数据集。将该文算法与几种欠采样算法进行对比实验，结果表明，该方法有效提高了不平衡数据集中少数类的预测精度。

单位
首都经济贸易大学

全文

访问全文

收藏分享被引浏览

更新时间：2024-03-19 20:22

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号