摘要
随着视频监控的广泛部署,海量监控视频中人群异常行为的检测和定位已成为研究热点。提出了基于改进生成对抗网络(Generative Adversarial Network, GAN)的四支路异常检测框架,并利用Mask-RCNN提高异常定位精度。通过在GAN中引入注意力机制,实现远距离空间区域之间关系的高效建模。通过四支路并行的GAN模块,提取不同类型和不同时间跨度的外观和运动信息,生成高质量的特征图。基于峰值信噪比(Peak Signal-to-Noise Ratio, PSNR)合并计算所有通道生成的图像,并训练支持向量机(Support Vector Machine, SVM)完成异常检测。利用Mask-RCNN提取异常视频帧的目标,并计算每个目标的异常概率,实现精准的异常定位。公开数据集上的实验结果表明,所提方法在Avenue和CSPD ped2数据集上的帧级AUC分别达到了91.4%和98.3%,像素级AUC分别达到了76.8%和97.2%,异常检测和异常定位性能均优于其他先进方法。
-
单位郑州工程技术学院