过去几年,视频行为分类从手工选择特征方式逐步向采用深度学习端到端网络模型方式转变。讨论了传统手工选择特征的行为分类方法以及基于深度学习的行为分类方法,着重对包括基于卷积神经网络、长短期记忆网络和时空融合网络等不同的深度学习方法进行了论述,并对常用视频行为分类数据集做了概述,对视频行为分类方法的发展进行总结和展望。