基于深度学习的RGB图像目标位姿估计综述

王一; 谢杰<sup>*</sup>; 程佳; 豆立伟

摘要

6自由度（DoF）位姿估计是计算机视觉与机器人技术中的一项关键技术，它能从给定的输入图像中估计物体的6DoF位姿，即3DoF平移和3DoF旋转，已经成为机器人操作、自动驾驶、增强现实等领域中的一项至关重要的任务。首先，介绍了6DoF位姿的概念以及基于特征点对应、基于模板匹配、基于三维特征描述符等传统方法存在的问题；然后，以基于特征对应、基于像素投票、基于回归和面向多物体实例、面向合成数据、面向类别级的不同角度详细介绍了当前主流的基于深度学习的6DoF位姿估计算法，归纳整理了在位姿估计方面常用的数据集以及评价指标，并对部分算法进行了实验性能评价；最后，给出了当前位姿估计面临的挑战和未来的重点研究方向。

单位
华北理工大学

收藏分享被引(5) 浏览

更新时间：2024-03-18 21:37

基于深度学习的RGB图像目标位姿估计综述

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友