基于视频关键帧提取和三维卷积的行为识别

作者:方婷红; 董建设*; 杨正昊; 王志凌
来源:天津职业技术师范大学学报, 2022, 32(04): 51-56.
DOI:10.19573/j.issn2095-0926.202204010

摘要

为提高行为识别的准确率,在C3D网络模型的基础上,提出一种基于视频关帧提取的三维卷积网络模型。该模型采用C3D网络模型的卷积层部分,结合CBAM注意力机制对人体行为视频提取特征进行行为识别;针对人体行为视频处理部分,采用视频聚类关键帧提取算法,对UCF101数据集进行关键帧提取,改善了原始模型不易关注视频中人体行为的关键帧情况,并利用水平翻转的方法对已经提取的关键帧进行数据增强。实验结果表明:本文提出的算法比原始C3D模型在UTF101数据集上的准确率(accuracy)提高了29.35%,网络中的参数量(params)比原有的C3D模型减少了26.06×106,性能也较其他常用方法有明显的提高。