摘要

分布式数据库系统和分布式并行计算是"地质云"2.0的关键技术。基于开源的分布式数据库系统HBase、并行计算框架Spark、空间信息服务器GeoServer等技术,完成了地质空间大数据系统设计与实现。本文论述了影响系统查询和计算性能的关键技术,并使用地质空间数据进行了系统实验和测试。实验结果表明,基于开源技术设计的地质空间大数据系统是可行的,比传统技术具有更加高效的性能。HBase分布式存储和空间索引技术显著提高了地质空间大数据的空间查询性能,Spark并行计算技术和多线程技术明显提升了地质空间大数据的计算性能。

  • 单位
    中国地质调查局发展研究中心