摘要

为充分提取视频序列中人体行为的静态特征与时域特征,提高人体行为识别算法的准确率,结合深度卷积神经网络与递归神经网络,提出一种端到端的网络模型,分别使用多帧叠加的RGB图像与光流图像作为网络输入,将基于RGB图像的人体行为特征与基于光流图像的人体行为特征进行加权融合,作为最终的人体行为特征。实验结果表明,该算法可以有效提高行为识别准确率,在公开数据集UCF101上取得了84.68%的平均准确率,高于改进前长效递归卷积神经网络(82.34%)。

全文