摘要

为了提升舞蹈动作识别的精度,提出了一种可动态适应的视频分割策略。该方法在提取中值补偿后的光流场下进行运动信息统计,通过设定帧分割的阈值得到不同帧长度的视频,并以此作为卷积神经网络的输入。在网络的传输映射上引入3D STPP结构,使用金字塔池化的思想对传统3D卷积神经网络的特性进行拓展。从视频输入序列中提取相同维度的特征描述算子,利用长期时间池化方法进行特征降维,并采用双层级优化函数进行求解。测试结果表明,改进网络的泛化性能有所提升,在两个测试数据集上的分类精度分别可达92.25%和66.48%。

全文