基于MapReduce框架下的K-means聚类算法的改进

宋阳; 石鸿雁

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

基于MapReduce框架下的K-means聚类算法的改进

作者：宋阳; 石鸿雁

来源：计算机与现代化, 2019, (08): 28-43.

摘要

针对K-means算法处理海量数据的聚类效果和速率,提出一种基于MapReduce框架下的K-means算法分布式并行化编程模型。首先对K-means聚类算法初始化敏感的问题,给出一种新的相异度函数,根据数据间的相异程度来确定k值,并选取相异度较小的点作为初始聚类中心,再把K-means算法部署在MapReduce编程模型上,通过改进MapReduce编程模型来加快K-means算法处理海量数据的速度。实验表明,基于MapReduce框架下改进的K-means算法与传统的K-means算法相比,准确率及收敛时间方面均有所提高,并且并行聚类模型在不同数据规模和计算节点数目上具有良好的扩展性。

单位
沈阳工业大学

收藏分享被引浏览

更新时间：2024-04-11 18:08

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号