摘要

接触网安全巡检装置拍摄的视频包含各种不同且复杂的场景,如何在整段视频中有效、准确、快速地挑选出重要场景以方便工作人员进行后续监测,是一个值得研究的课题。针对该课题,提出一种基于注意力机制的铁路巡检视频场景分类方法。首先利用Inception-v3网络对视频帧图像进行特征提取;然后在双向GRU神经网络对视频帧序列的特征进行建模时,引入注意力机制为提取的视频帧特征信息分配相应的权重以代表其特征的重要程度;最后将包含有帧与周围帧之间联系的特征信息放入分类器进行巡检视频的场景分类。应用该方法对成渝客专下行线路的巡检视频进行实验,结果显示,本模型的准确率为95.2%,召回率为97.5%,F值为0.962。实验结果证明了本文方法对视频场景分类的有效性。