基于Hadoop平台的一种改进K-means文本聚类算法

潘俊辉; 王辉; 张强; 王浩畅

doi:10.3969/j.issn.1007-757X.2022.01.003

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

基于Hadoop平台的一种改进K-means文本聚类算法

作者：潘俊辉; 王辉; 张强; 王浩畅

来源：微型电脑应用, 2022, 38(01): 5-7.

DOI：10.3969/j.issn.1007-757X.2022.01.003

摘要

K-means算法是进行文本聚类时使用最为广泛的一种推荐算法之一。该算法在进行文本聚类时每个属性的作用是同等的,而实际中每个属性对文本的影响是不同的,导致聚类效果受到影响。针对该缺点,通过引入属性权重提出了一种改进的K-means聚类算法,并在Hadoop平台加以实现,以更好体现改进算法的效率。通过实验进行了测试,表明所提出的改进算法在效率和精度方面均有所提高。

单位
东北石油大学

全文

访问全文

收藏分享被引浏览

更新时间：2024-03-22 19:33

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号