摘要

针对从海量出租车GPS位置点数据中提取载客轨迹问题,在分析位置点数据存储结构的基础上,提出一种基于MapReduce的分布式处理算法,实现出租车载客轨迹的分布式提取。通过自定义联合键、分区和分组,有效利用MapReduce的二次排序功能实现按出租车标识提取载客轨迹。实验表明,提出的分布式算法较好地解决了海量数据的并行提取。

  • 单位
    平顶山学院

全文