摘要

针对目前单目图像在深度估计中依然存在边缘以及深度最大区域预测不准确性的问题,本文提出一种基于金字塔分割注意力网络的单目深度估计方法(PS-Net)。首先,PS-Net以边界引导和场景聚合网络为基础,引入金字塔分割注意力模块(PSA),处理多尺度特征的空间信息并且有效建立多尺度通道注意力间的长期依赖关系,提取出深度梯度变化剧烈的边界和深度最大的区域;然后,使用Mish函数作为解码器中的激活函数,进一步提升网络的性能;最后,在NYUD v2和iBims-1数据集上进行训练评估。iBims-1数据集上的实验结果显示该网络在衡量定向深度误差方面与边界引导和场景聚合网络(BS-Net)相比提高了1.42个百分点,正确预测深度像素的比例达到81.69%。因此,实验结果可以证明本网络在深度预测上具有较高的准确性。