摘要

6D位姿估计是计算机视觉与机器人技术中的一种关键技术,它通过从给定的输入图像中估计物体的6D位姿,即3D平移和3D旋转,已经成为机器人操作、自动驾驶、增强现实等领域中的一项至关重要的任务。首先介绍了6D位姿的概念以及基于特征点对应、基于模板匹配、基于三维特征描述符等传统方法存在的问题;重点以基于特征对应、基于像素投票、基于回归和面向多物体实例、面向合成数据、面向类别级的不同角度详细介绍了当前主流的基于深度学习的6D位姿估计算法,归纳整理了在位姿估计方面常用的数据集以及评价指标,并对部分算法进行了实验性能评价;最后给出了当前位姿估计方面面临的挑战和未来的重点研究方向。