基于Spark的并行反向k最近邻查询

作者:杨泽雪; 张毅*; 李陆; 刘伟东; 蒋超
来源:计算机工程与设计, 2022, 43(12): 3340-3347.
DOI:10.16208/j.issn1000-7024.2022.12.006

摘要

为提高海量空间大数据的反向k最近邻查询效率,采用当前流行的大数据处理框架Spark,对并行反向k最近邻查询进行研究。基于Spark框架构建并行索引结构,利用Voronoi图处理反向k最近邻查询的良好性能,构建基于网格和Voronoi图的双层索引结构;利用双层索引结构,给出高效的并行反向k最近邻查询的过滤精炼处理算法SV_RkNN,给出相关定理及证明。真实数据实验结果表明,所提SV_RkNN算法具有较高的查询效率。