摘要

列控车载设备故障复杂且车载记录数据为海量非结构化文本,针对车载记录数据特点,提出基于卷积神经网络的车载设备故障智能分类模型。使用CBOW模型实现车载记录数据的文本分布式表示;为提高网络的泛化性,加快网络收敛,利用加入批归一化处理的卷积神经网络实现故障分类;考虑到不平衡、难分样本对分类效果的影响,通过SMOTE算法随机生成少数类文本向量数据,之后在卷积神经网络的训练阶段采用焦点损失函数对样本加权,实现不平衡数据间的调整。通过对某铁路局列控车载记录数据进行试验分析,表明该模型可以有效提升列控车载故障分类的精确率Precision、召回率Recall、F1-Measure和G-mean等指标。