一种基于Spark的图像聚类并行化算法

作者:张振; 冯永亮; 赵津曼
来源:电子制作, 2019, Z1: 67-108.
DOI:10.16589/j.cnki.cn11-3571/tn.2019.z1.025

摘要

在分析Spark并行计算框架的基础上,结合K-means聚类算法特征,设计了一种基于Spark的图像聚类并行化算法,该算法针对RDD进行分布式迭代计算,同时将运算的中间结果分布式缓存到各个节点的内存中,有效降低了内存读取和磁盘I/O操作的延迟,有效提高了并行计算效率。经测试,该算法提高了图像聚类的性能。