摘要
为了寻求能够高效拟合事故数据的模型,提高高速公路交通事故预测的能力,以广东省京珠、粤赣以及开阳高速为研究对象,收集整理了共4 657起交通事故及相关影响因素数据,通过路段划分得到5 573个交通事故建模样本。基于系统聚类及四分位数法,筛选交通事故数据中的异常值,剔除了建模样本中的离群样本;基于方差膨胀因子法,对模型的解释变量进行共线性诊断,对存在共线性问题的解释变量进行了处理。分别对负二项(NB)、零膨胀负二项(ZINB)及Tobit模型进行变量筛选,分别确定了16,24,16个解释变量;基于模型变量筛选结果,利用交通事故数据样本,完成了NB,ZINB及Tobit模型的建模。分析对比了NB,ZINB及Tobit模型的拟合效果及预测能力,结果显示,在模型的事故预测能力方面,当交通事故数据中存在大量零值,NB,ZINB及Tobit模型经过K折交叉检验计算得出的PRESS值分别为2 185,2 239,4 442,表明Tobit模型预测能力最优,ZINB模型其次,NB模型再次。
- 单位