摘要
在自动驾驶场景中存在着光照、天气、路面状况等复杂多变的因素,这些因素会导致现有的语义分割方法在小目标物体的分割效果上存在注意力缺失的问题。为了解决这一问题,文中提出一种优化双注意力机制的方法,该方法的主要思想是通过引入位置和通道注意力机制生成权重,从而增强特征的表征能力。首先,位置注意力机制通过学习每个像素点在空间上的重要性,生成与位置相关的权重。其次,通道注意力机制通过学习每个通道在特征表示中的重要性,生成与通道相关的权重,将得到的位置注意力和通道注意力权重与输入特征进行逐元素相乘,以增强特征的表征能力。最后,将2个注意力模块的输出特征进行融合。实验结果表明,改进后的网络模型明显提升了语义分割精度,且在Cityscapes数据集上的平均交并比(mean intersection over union, mIou)达到了80.4%,相较于全卷积神经网络(fully convolutional networks, FCN)方法提升了10.4%。
- 单位