摘要

针对单目3D目标检测在视角变化引起的物体大小变化以及物体遮挡等情况下效果不佳的问题,提出了一种融合深度信息和实例分割掩码的新型单目3D目标检测方法。首先,通过深度—掩码注意力融合模块(depth-mask attention fusion module, DMAF),将深度信息与实例分割掩码结合,以提供更准确的物体边界;其次,引入动态卷积,并利用DMAF模块得到的融合特征来引导动态卷积核的生成,以处理不同尺度的物体。此外,在损失函数中引入2D-3D边界框一致性损失函数,以调整预测的3D边界框与对应的2D检测框高度一致,以提高实例分割和3D目标检测任务的效果;最后,通过消融实验验证该方法的有效性,并在KITTI测试集上对该方法进行验证。实验结果表明,该方法在中等难度下对车辆类别检测的平均精度比基线方法提高了6.36个百分点,且3D目标检测和鸟瞰图目标检测任务的效果均优于D4LCN、M3D-RPN等对比方法。