摘要

针对人手全局姿态估计误差较大的问题,提出了一种基于像素投票的人手全局姿态估计方法。建立编码器-解码器结构卷积神经网络产生语义信息与姿态信息特征图;分别利用语义分割分支、姿态估计分支从特征图中获取人手像素位置与逐像素姿态投票,最后汇总人手像素的姿态投票获得投票结果。为解决人手全局姿态数据集较少的问题,通过OpenSceneGraph(OSG)三维渲染引擎和三维人手模型建立人手数据集合成程序。该程序可生成不同手势下的人手深度图像与全局姿态标签。实验结果表明,基于像素投票的人手全局姿态估计方法的误差均值为5.036°,可以准确地从深度图像中估计人手全局姿态。