摘要

在人体姿态估计领域中,基于响应图回归的深度学习方法虽然占据了主导地位,但其优化目标是建立每个训练样本的人体表观信息与相应关节点坐标之间的对应关系,从而对训练数据的多样性有较强的依赖。而在面向无约束场景的人体姿态估计任务中,无规则变化的人物服饰、复杂的场景和高灵活度的姿态等因素导致样本的分布极其复杂。因此,真实世界中的训练集通常远远无法涵盖所有可能的变化情况,存在由于一些样本不足的少见姿态形式所导致的样本不均衡现象。该现象使得回归网络在训练中不可避免地编码了与姿态无关的表观信息,最终影响了算法的泛化能力。基于上述问题,为了在有限的训练数据下增强网络对姿态识别的鲁棒性,提出在回归网络中通过度量学习方法来优化高层特征对人体姿态的判别性。同时为了更好地在人体姿态估计的框架下建模该判别学习任务,进一步提出了基于点特征优化的局部样本关系模型(Local Sample Relation Module, L-SRM)。实验结果表明,该方法可对样本间的相似度进行更合理的建模,从而有效地辅助度量学习优化人体姿态估计算法的性能和泛化能力。