摘要
深度图的引入为RGB显著性检测提供了丰富的位置线索,但低质量的深度图会错误引导模型的特征拟合,并且由于真实世界的显著物体尺度变化较大,会使网络在预测过程中更加困难,误差变大.为了解决上述问题,本文设计了一种新的基于深度学习的RGB-D显著性检测模型.本文利用VGG19作为主干网络分别提取RGB图和深度图两个模态的特征;然后利用串行的自适应融合模块对提取到的特征进行跨模态融合,使RGB图和深度图的优势互补,自动筛选深度特征;接着利用联合边缘检测的多尺度特征聚合模块将跨模态融合后的特征与边缘信息融合;最后通过全局引导模块对模型进行全局特征引导,得到预测结果.利用本文方法对4个公开数据集上的图像进行了预测,并与6种不同的方法进行对比,本文方法预测结果更接近人工标定的真值图.PR(Precision-Recall)曲线、S(S-measure)指标、F(F-measure)指标和MAE(Mean Absolute Error)指标显示,本文方法的整体性能较其中6种方法高.
- 单位