摘要
行为识别是计算机视觉领域意义重大的热点研究问题,它经历了从手工设计特征表征到深度学习特征表达的发展过程。本文从传统行为识别模型和深度学习模型两个方面,对行为识别发展历程中产生的主流算法进行了归类梳理。传统行为识别模型主要包括了基于轮廓剪影、时空兴趣点、人体关节点、运动轨迹的特征描述的方法,其中,改进的密集轨迹方式拥有良好的鲁棒性和可靠性;深度学习网络架构主要有双流网络、3D卷积网络和混合网络。首先,我们重点阐述了各行为识别算法的主要研究思路与创新点,并介绍了每类算法的模型架构、算法特色、适用情境等。然后,对广泛使用的公共行为数据库进行了分类阐述,着重对HMDB51和UCF101数据集进行了详细介绍,比较分析了传统方法和深度学习算法在各数据集上的识别效果。通过对比分析发现,传统方法不适用于高精细行为的识别,且不易实现跨数据库或跨场景的推广;深度架构中,双流网络和3D卷积网络获得了比较好的行为识别效果且被广泛使用。最后,在结论中对行为识别的未来发展进行了展望,指出了若干将来可行的研究方向。
-
单位河南财经政法大学; 郑州航空工业管理学院