摘要
针对大规模动作识别时间长、识别精度低等问题,本文提出基于Spark框架的特征提取并行解决方法,利用Spark的内存计算能力,将视频数据分割成视频或帧,并将其放置到弹性分布式数据集(Resilient Distributed Datasets Sets,RDDS)中进行后续处理,针对主流的深度学习特征提取方法:轨迹池深度卷积描述符(Trajectory-Pooled Deep-Convolutional Descriptors,TDD)、潜在概念描述符(Latent Concept Descriptor,LCD)和改进密集轨迹(Improved Dense Trajectories,IDT),给出分布式并行算法,并设计了局部特征聚合描述符(Vector Of Locally Aggregated Descriptors,VLAD)分布式编码算法,将提取的特征聚合到全局表示中,然后输入到深度学习模型分类器中识别视频中的动作.实验结果表明:本文方法提高了人类动作识别的实时性,且LCD在识别精度和处理时间之间的权衡优于其他几种方法.
-
单位电子信息工程学院; 重庆工商职业学院; 重庆邮电大学