摘要

传统的YOLO v3模型通常利用COCO等与测试集目标场景特征差异较大的数据集进行训练,导致对高分遥感影像中复杂场景目标检测精度不高,本文提出了一种对YOLO v3网络训练过程进行优化的方法。该方法是基于迁移学习的思想,在YOLO v3网络训练中,通过生成与目标域更相似的增广数据集对模型进行预训练,实现了训练过程的优化,以提高目标初始预测的精度;其次,利用目标域训练数据对预训练模型参数进行微调,完成了对网络的训练。利用公开的RSOD和DIOR遥感图像目标检测数据集的子集对飞机、运动场、立交桥三大类目标进行模型训练和检测实验,结果表明:本文提出的训练优化后的YOLO v3模型有效地提高了复杂城区场景中上述三类目标的检测精度。与传统的YOLO v3模型相比,三类目标的平均精准度(mAP)均值提高了2%以上。