基于视频关键帧提取和三维卷积的行为识别

方婷红; 董建设<sup>*</sup>; 杨正昊; 王志凌

doi:10.19573/j.issn2095-0926.202204010

摘要

为提高行为识别的准确率，在C3D网络模型的基础上，提出一种基于视频关帧提取的三维卷积网络模型。该模型采用C3D网络模型的卷积层部分，结合CBAM注意力机制对人体行为视频提取特征进行行为识别；针对人体行为视频处理部分，采用视频聚类关键帧提取算法，对UCF101数据集进行关键帧提取，改善了原始模型不易关注视频中人体行为的关键帧情况，并利用水平翻转的方法对已经提取的关键帧进行数据增强。实验结果表明：本文提出的算法比原始C3D模型在UTF101数据集上的准确率（accuracy）提高了29.35%，网络中的参数量（params）比原有的C3D模型减少了26.06×106，性能也较其他常用方法有明显的提高。

单位
天津职业技术师范大学

全文

访问全文

收藏分享被引(2) 浏览

更新时间：2024-03-19 18:42

基于视频关键帧提取和三维卷积的行为识别

摘要

全文

产品服务

站内浏览

服务支持

联系方式

科研之友