多种缺失模式下交通数据组合近似填补方法

作者:郭凤香; 黄金涛; 陈昱光; 郭延永; 刘攀*
来源:交通运输系统工程与信息, 2023, 23(06): 42-50.
DOI:10.16097/j.cnki.1009-6744.2023.06.005

摘要

随着智能交通系统中采集和应用的基础数据规模不断扩大,数据缺失问题的重要性也日益凸显。针对交通数据中常出现的数据随机缺失和连续缺失问题,本文提出基于鲸鱼优化算法优化最小二乘支持向量机的组合近似填补方法(Combined Approximate Filling, CAF)。考虑缺失数据整体变化趋势的同时,参考数据的波动特征,根据多重填补思想对缺失值分别使用单变量填补和多变量填补,然后引入图片识别中自适应阈值分割法对不同时段下的差异值进行动态划分处理,最后利用不同时段的动态差异度阈值将单变量填补和多变量填补的结果进行结合,完成缺失值的高精度近似填补。为验证填补方法的性能,利用云南省玉溪市大量实车轨迹处理数据设计多组实验。实验结果表明,在小样本数据中,CAF填补方法能够适应多种场合的填补工作,该方法总体优于其他方法,在不同缺失率下均表现良好,尤其是随机缺失填补,最大RMSE为0.365。实验还证明了该方法在不同缺失类型和不同数据离散度下数据填补效果相比于其他方法优势更加明显。

全文