摘要

边界框回归(BBR)已广泛应用于目标检测和实例分割,这是目标定位的一个重要步骤,但仍存在收敛缓慢和回归不准确的问题。本文研究发现大多数现有的边界框回归损失函数在预测框与标注框具有相同的纵横比,但宽度和高度值不同时损失函数值无法收敛。为了解决这个问题,本文充分挖掘矩形的几何特征,提出了一种最小点距离的边界框相似度度量MPDIoU,它包含了现有主流边界框回归度量的相关因素,即重叠或非重叠面积、中心点距离、宽度和高度的偏差,同时简化了计算过程。在此基础上,本文提出了一个最小点距离的边界框回归损失函数,称为■。实验结果表明,MPDIoU损失函数应用于最先进的实例分割(例如YOLACT)和目标检测(例如YOLOv7)模型训练PASCAL VOC、MS COCO和IIIT5k,其性能优于现有损失函数,模型回归效率和精度得到有效提升。