摘要

利用改进的端到端学习目标检测算法对普通摄像头拍摄的RGB视频图像中的手部目标进行检测。在检测时将特征映射函数重新定义,使其满足特征图谱具有高分辨率并且将图像转为特征图谱的卷积层足够深的条件,使用交叉熵损失作为分类损失函数。利用HR-MANO对手部姿态动作进行3D估计和识别,将手部的标准mesh由一个平均mesh替代,在MANO算法模型之前增加了HRNet和ResNet网络。实验在FreiHAND数据集上进行,结果表明算法模型优于其他方法,能够对手姿态动作进行有效识别。