摘要
本发明涉及一种视频手势分类方法。所涉及的方法包括:对同一对象集的可见光视频和深度视频进行归一化处理;计算可见光视频中每一帧图像的显著性,得到显著性视频;分别利用归一化后的可见光视频、深度视频、显著性视频对三维卷积神经网络进行训练,所述三维卷积神经网络包括:依次设置的输入层、18个卷积层、全局平均池化层和全连接层;对得到的可见光视频、深度视频和显著性视频的空域维度的全局平均池化层的特征进行特征融合得到融合特征,根据得到的融合特征进行视频手势分类。本发明所针对的问题是基于视频的大规模手势识别,其类别数据和视频数据量都远大于现有发明。本发明能够对视频进行实时识别,更具可信度和实用性。
- 单位