摘要

3D目标检测是计算机视觉和自动驾驶中一项重要的场景理解任务。LiDAR可以提供准确的3D信息但价格昂贵,单目相机价格便宜却缺乏可靠的深度信息。因此,基于立体图像的3D目标检测方法成为当前研究的热点。当前基于立体图像的3D目标检测方法大多没有充分考虑多个目标之间的尺度存在较大差异,从而尺度小的物体容易被忽略,导致检测精度低。针对这一问题,提出了一种基于立体图像的多路径特征金字塔网络(Multipath Feature Pyramid Network, MpFPN)3D目标检测方法。MpFPN对特征金字塔网络进行了扩展,增加了一条自底向上的路径、由上至下的路径以及输入特征图到输出特征图之间的连接,为联合区域提议网络提供了更高语义信息和更细粒度空间信息的多尺度特征信息。实验结果表明,在3D目标检测数据集KITTI上,无论在场景简单、中等、复杂情况下,提出的方法获得的结果都优于现有方法的结果。

全文