摘要
近年来,高清摄像头广泛应用于城市交通系统,产生了大量交通卡口过车数据集。该数据集为路段行车时间计算提供了一个良好的数据源。但是,由于该数据集规模较大,现有算法通常采用MapReduce大数据并行模型进行计算以提高效率。然而,现有基于MapReduce模型的路段行车时间计算方法采用两作业迭代完成,两作业之间存在涉及大规模磁盘数据存储,额外消耗了时间,导致性能下降。为此,文章提出一种基于Spark大数据模型的路段行车时间Spark-CoRLTT计算方法,该方法通过1次作业完成计算,避免了额外磁盘数据存储,节约了计算时间。实验证明,文章提出的算法在数据规模较大的情况下,计算性能显著提升。
-
单位中国矿业大学(北京); 中国矿业大学; 河南工学院