摘要

动态手势识别通常使用RGB-D融合数据来训练三维卷积神经网络,识别精度较高并且鲁棒性较强,但是存在数据量大、模型复杂度高的问题,给模型训练带来了一定困难。论文提出了一种基于TSM(Time Shift Module,时间移位模块)框架的动态手势识别模型,能够减小网络复杂度和模型训练所需的数据量。该模型在大型手势数据集EgoGestrue和Chalearn IsoGD LAP上的准确率分别为88.8%和69.3%,在RGB模式上的识别效果能够接近RGB-D模式,而数据量和复杂度却大大降低,体现了其高效、轻量以及鲁棒性较高的特点。