摘要

随着大数据技术的飞速发展,空间大数据已成为一个主要的研究方向。而空间数据存储、查询效率的优化是空间大数据的核心问题。笔者比较了Hadoop与SpatialHadoop的优缺点,并基于Hadoop平台,数据采用OGC标准制定的WKT格式,以MapReduce为矢量数据建立索引,分别讨论了R树索引与四叉树索引适用的对象,并进一步采用数据压缩的方式优化了线与面的存储与查询效率。