基于Spark的路网交通运行分析系统

作者:杨孟; 许宏科; 钱超; 朱熹
来源:武汉理工大学学报(交通科学与工程版), 2020, 44(04): 707-712.
DOI:10.3963/j.issn.2095-3844.2020.04.023

摘要

应用Spark大数据平台,设计了一种路网交通运行分析系统.以实时交通流数据为基础,结合k-means和随机森林算法构建了路网交通运行态势判别模型,选择分布式文件系统存储和弹性分布式数据集并行处理交通数据,实现了路网交通运行状态的实时判别.利用西奥克兰地区路网车检器数据展开实例分析,结果表明:该系统的运行速度快;分布式k-means算法相较于传统的算法聚类结果的平均相对误差约为7.3%,具有较高的准确性;分布式随机森林算法的精确度、召回率和F度量分别为98.98%,98.96%,98.97%,分类结果均优于逻辑回归、多层感知器算法.

全文