摘要

针对基于单图像城市场景中不规则平面 3D重建的难题,本文提出了一种基于多尺度聚焦网络的场景 3D平面重建算法。该算法以单幅 RGB图像为输入,通过单网络、双任务的学习策略,同时输出平面的分割映射以及深度信息。为了根据上下文来自适应的更改有效感受野大小以获取多尺度信息,本文还提出了一种将条状注意力机制嵌入到空洞空间金字塔池化模块的多尺度聚焦模块,使之能够关注城市场景中的条状平面。本文网络模型在 SYNTHIA 城市场景数据集上进行了训练,在测试集中取得了 81.5%SC 和 4.22%Abs Rel 的表现。本文算法相对于现有算法更可靠、重建模型更完整。