摘要

为解决高速公路ETC用户的分类问题,利用大数据挖掘技术提出了多种基于高速公路ETC用户使用特征的分类模型。首先,在传统特征指标的基础上,加入最长使用间隔作为用户分类指标,建立新的用户分类指标体系;其次,构建K-means,模糊C-均值和SOM(自组织映射神经网络)3种机器学习模型,并利用多种分类评价指标综合考虑用户分类效果。实例分析表明,3种分类模型均实现了6类用户的分类任务,其中SOM模型的评价指标最优,表明非监督机器学习方法SOM在大规模数据分析中的优势;最后,针对不同种类ETC用户使用差异化的收费管理策略进行讨论,认为大数据挖掘技术可以进一步提高高速公路ETC系统的管理决策水平。