一种基于抽样改进加权核K-means的大数据谱聚类算法

金海; 张劲松; 吴睿

doi:10.13474/j.cnki.11-2246.2018.0354

摘要

经典谱聚类将数据聚类转化为加权图划分问题,在分析Normalized Cut目标函数与加权核K-means函数等价基础上,设计了一种基于抽样改进加权核K-means算法的大规模数据谱聚类算法。算法通过Leaders进行初始聚类预处理,以控制后续随机抽样的数据规模及对原始数据类别的覆盖,通过抽样子集内加权核K-means迭代优化,避免Laplacian矩阵特征分解的大量资源占用,从而以部分核矩阵的使用避免全部核矩的时间、空间复杂度。试验结果表明,改进算法在保持与经典算法相近聚类精度基础上,大幅提高了聚类效率。

单位
浙江工业大学; 深圳职业技术学院; 西安交通大学

全文

访问全文

收藏分享被引浏览

更新时间：2024-04-24 21:41

一种基于抽样改进加权核K-means的大数据谱聚类算法

摘要

全文

产品服务

站内浏览

服务支持

联系方式

科研之友