摘要
针对高速公路收费数据中的异常检测和修复问题,分别了提出了基于相似系数和SSC(Sum of similar coefficients)的异常检测算法以及基于XGBoost(eXtreme gradient boosting)的多维数据预测修复方法,并使用这两种算法对实际收费数据进行了异常检测和修复处理。结果表明,基于SSC的异常检测算法能够考虑到数据维度之间的相关性,准确地对多维数据异常检测;同时XGBoost多元预测算法与仅针对单维数据的改进拉格朗日算法相比,R2从0.9166提升至0.9856。本文算法有效而准确,能够为公路管理部门数据分析提供高质量的数据支持。