摘要
由于传统的监控视频异常检测和定位往往存在特征选择困难、特征学习不足、泛化性差等问题,本文提出一种融合SimAM注意力机制(A Simple, Parameter-Free Attention Module)和双向ConvLSTM(bidirectional convolutional long short-term memory, BiConvLSTM)的深度残差时空自编码器模型(SimAM Based Residual BiConvLSTM Autoencoder, RS-BCAE)用于捕获视频异常.使用堆叠卷积和双向ConvLSTM捕获时空特征,利用交替反卷积和卷积的特征图增强方法优化网络结构.本文设计一种融合R-STAE(Residual Spatiotemporal Autoencoder)残差模块和SimAM注意力机制的残差网络,SimAM注意力机制无需添加额外参数,利用能量函数为特征图生成三维注意力权重,使CNN(Convolutional Neural Network)专注于提取视频帧序列的显著区域特征.为了联合全局特征和关键特征,本文为残差模块引入跳跃连接.实验结果表明,RS-BCAE在数据集UCSD-Ped1和UCSD-Ped2上的帧级准确率分别为86.5%和94%,优于最新的重构模型精度.
- 单位