摘要

针对传统暴力行为识别算法精度不高和三维卷积神经网络参数多的问题,本文提出一种基于3D SE-Densenet网络的视频暴力行为识别改进算法。采用3D Densenet模型提取视频中的时空特征信息,SENet(Squeeze-and-Excitation Networks)按照时空特征的重要性程度进行加权处理,根据加权的时空特征识别视频中的暴力行为。实验结果表明,本文提出的3D SE-Densenet方法在Hockey Fights Dataset和Movies Dataset上识别准确率分别达到99.1%和100%,可较准确地识别暴力行为,准确率高于传统方法。