摘要

鉴于自监督单目深度估计在高分辨率图像下还存在特征提取不够充分、图像信息获取不完整、深度图物体轮廓模糊等问题,提出了一种全新的Monobin网络模型,模型将CNN与Transformer模块相结合,能够在局部和全局范围内进行推理,同时通过Adabins模块实现对深度的高细节和高准确度预测。在KITTI数据集上的结果显示,模型的均方根误差、均方根对数误差、绝对相对误差、平方相对误差分别为4.421、0.178、0.102和0.717,均低于现有算法;三个阈值准确度分别为0.896、0.966和0.984,均高于现有算法。通过消融实验和对比实验验证了模型的有效性和正确性。

全文