摘要
单目深度估计作为计算机视觉的基本问题,得到人们的广泛关注。目前的方法多集中在深度卷积神经网络的图像级信息上,训练时收敛速度较慢,精度下降,特别是在图像中拥有不同大小的多目标情况下。为此,本文基于一个编解码框架提出了一个新的卷积神经网络模型结构DCDN(Deep Convolution DenseASPP Network),并将其应用到深度估计中。不同尺度的物体特征需要不同的卷积核去获取,对于多目标的图像,用不同的卷积核去获取他们的特性。本文采用稠密链接的空洞卷积组,利用不同扩张率的空洞卷积去强化多尺度目标的特性学习。实验结果表明,该方法在NYU-Depth-v2数据集上达到了0.823的准确率(阈值<1.25),优于最先进的方法。
- 单位