摘要

为提高混凝土坝面作业场景识别工作效率,提出了一种混凝土坝面作业场景智能识别方法(ResNet50-SEMSF)。将采集的坝面施工现场监控视频分割为图像,分析混凝土坝面作业人、机、料、环等实体要素图像特征,界定坝面作业典型场景;以残差网络(Residual Network 50, ResNet50)为骨干网络结构,引入挤压激励(Squeeze and Excitation, SE)注意力机制,关注不同通道间特征关系,提升坝面作业场景图像中多目标实体要素关键特征表达能力;融合下采样多尺度特征,保留坝面作业场景图像低级特征和高级语义信息,增强模型对图像不同层次特征的理解能力,克服尺度变化、目标变形等问题。对比分析其他3种卷积神经网络模型试验结果,使用类激活映射(Grad Class Activation Mapping, GradCAM)可视化方法,解释ResNet50-SEMSF模型对场景类别中实体要素信息的关注程度。结果表明:ResNet50-SEMSF识别效果明显优于ResNet50、MobileNetV2、VGG16经典网络模型,表征ResNet50-SEMSF模型用于混凝土坝面作业场景智能识别的可行性,为混凝土坝面施工安全管理工作提供参考。

  • 单位
    国家能源投资集团有限责任公司; 三峡大学