摘要

目标检测和语义分割被广泛应用在自动驾驶领域,包括对车辆、行人、车道线的检测。而目前大部分算法仅仅实现一种任务,不能满足对多重环境信息感知的需求。针对上述问题,提出了一种联合训练目标检测和语义分割的YOLOSeg算法。使用MobileNetv3作为YOLOSeg中的特征提取网络,减少了模型的参数量。PANet用于融合不同尺度的特征图,增加对小目标信息信息的捕捉能力。在语义分割分支中利用空洞卷积池化金字塔增加感受野,通过双线性插值得到图像分割结果。实验结果表明,该方法图像分割速度相较RefineNet提升35帧/s。平均交并比提升4.9%。目标检测的mAP@0.5相较YOLOv5s提升1.3%。YOLOSeg平衡了在复杂交通场景中对检测精度和速度的要求。