摘要
人体动作识别是当前视频处理领域研究热点,鉴于双通道网络无法对视频的长范围时间结构建模,故采取时间段卷积神经网络(CNN)结构对其进行了改进,提出了基于时间段的双通道CNN算法。首先,采用时间段网络对整个视频进行稀疏采样,并对序列中的每个片段生成动作类别预测;然后,在时间通道和空间通道上分别融合来自所有片段的预测,以生成最终分类;最后,在复杂数据集UCF101和HMDB51上进行了验证。试验结果表明,相对于3D卷积(C3D)和时间通道网络等算法,该算法具有较高的识别正确率和鲁棒性。
-
单位中国电子科技集团公司第二十八研究所