摘要
为提高海量空间大数据的反向k最近邻查询效率,采用当前流行的大数据处理框架Spark,对并行反向k最近邻查询进行研究。基于Spark框架构建并行索引结构,利用Voronoi图处理反向k最近邻查询的良好性能,构建基于网格和Voronoi图的双层索引结构;利用双层索引结构,给出高效的并行反向k最近邻查询的过滤精炼处理算法SV_RkNN,给出相关定理及证明。真实数据实验结果表明,所提SV_RkNN算法具有较高的查询效率。
-
单位东北林业大学; 黑龙江工程学院