摘要
为提高行为识别的准确率,在C3D网络模型的基础上,提出一种基于视频关帧提取的三维卷积网络模型。该模型采用C3D网络模型的卷积层部分,结合CBAM注意力机制对人体行为视频提取特征进行行为识别;针对人体行为视频处理部分,采用视频聚类关键帧提取算法,对UCF101数据集进行关键帧提取,改善了原始模型不易关注视频中人体行为的关键帧情况,并利用水平翻转的方法对已经提取的关键帧进行数据增强。实验结果表明:本文提出的算法比原始C3D模型在UTF101数据集上的准确率(accuracy)提高了29.35%,网络中的参数量(params)比原有的C3D模型减少了26.06×106,性能也较其他常用方法有明显的提高。
- 单位