摘要

传统三维卷积神经网络随着网络层数的加深,参数量增多容易导致过拟合,且不能充分提取视频特征。本文以3D ResNet101网络为基础,建立了一种基于三维残差网络分组膨胀卷积(3D GD-ResNet)的人体行为识别方法,首先将视频帧图像输入到三维卷积神经网络中提取时间和空间维度的浅层信息,然后在GD-ResNet模块将三维残差块分成32组,减少模型参数量;同时在每个分组卷积中使用膨胀系数为3的膨胀卷积扩大感受野,以提取更深层的特征信息,最后通过softmax进行分类输出。在UCF101数据集上进行验证,人体行为识别准确率达到了88.4%,验证了本文方法的有效性。