摘要

在固定监控场景下的人体异常行为检测任务中,行为正常与否判定很大程度上与其发生时的背景息息相关,因此,需要检测模型从全局考虑而非只是行为本身;基于卷积神经网络的自编码器检测模型通常缺乏部分与整体之间的交互,且存在泛化能力过强的不足。针对此两方面问题,提出一种全局自注意力与卷积特征共享的自编码器异常行为检测模型SW-MemAE,该模型以全局注意力捕捉图像整体特征交互信息,在瓶颈处插入记忆模块以约束自编码器对于正常行为的过度泛化,通过视频前四帧和预测帧间的重构误差来判断是否存在异常行为。使用USCD-Ped2、CUHK Avenue两个基准数据集对该模型性能开展实验,结果表明,相比于其他基于预测或重构的视频异常行为检测模型,提出SW-MemAE模型在AUC指标上分别达到95.69%、84.1%,检测性能表现良好。

全文