摘要

针对单目3D目标检测网络训练约束少、模型预测精度低的问题,通过网络结构改进、透视投影约束建立以及损失函数优化等步骤,提出了一种基于透视投影的单目3D目标检测网络.首先,在透视投影机理的基础上,利用世界、相机以及目标三者之间的变换关系,建立一种利用消失点(VP)求解3D目标边界框的模型;其次,运用空间几何关系和先验尺寸信息,将其简化为方位角、目标尺寸与3D边界框的约束关系;最后,根据尺寸约束的单峰、易回归优势,进一步提出一种学习型的方位角―尺寸的损失函数,提高了网络的学习效率和预测精度.在模型训练中,针对单目3D目标检测网络未约束3D中心的缺陷,基于3D边界框和2D边框的空间几何关系,提出联合约束方位角、尺寸、3D中心的训练策略.在KITTI和SUN-RGBD数据集上进行实验验证,结果显示本文算法能获得更准确的目标检测结果,表明在3D目标检测方面该方法比其他算法更有效.

  • 单位
    中国人民解放军陆军工程大学