摘要
针对高速公路场景的天气识别问题,提出了基于Vision Transformer的天气种类自动识别算法。采集了广东省多条高速公路的监控视频图像,建立了高速公路监控场景下天气分类数据库,包括晴天、雨天、浓雾等天气场景。为了分析Vision Transformer自注意力机制的特性,利用特征图可视化手段对全连接层特征图的分类贡献作分析,分类贡献图像显示Vision Transformer分类网络的分类判断依据与人类视觉有相似之处,能有效关注到相同监控场景下不同天气图像的差异性。试验过程中,通过迁移学习方法以及数据增强的图片预处理方法提高了分类网络性能与鲁棒性,并测试对比了Vision Transformer与传统卷积神经网络在天气分类任务中的分类精度和识别速度。试验结果表明:由于具有自注意力机制,相比传统卷积神经网络,Vision Transformer特征提取能力更为高效,在天气图像分类任务中最高识别精度达到99.1%;在中小型数据集的分类任务中,压缩网络自注意力结构能保证识别精度的同时显著提高分类速度,达到与轻量化卷积神经网络相同的分类速度。试验过程中压缩自注意力层的Vision Transformer网络与原网络相比,识别精度仅降低了0.1%,识别速度提高了15.9%。
- 单位