摘要
无人机视频具有视角灵活、视域连续、监视范围广等优点,但同时也存在目标分布密集、运动噪声强等问题,给准确的目标检测造成了困难。针对这些问题,提出结合帧间目标回归网络的无人机视频车辆检测算法。根据无人机视频中车辆目标密集分布的特点,提出软化非极大值抑制作为单阶段全卷积目标检测的检测框合并策略,进而构建单帧车辆检测器;为应对单帧检测器直接应用于视频检测时易受运动噪声干扰、造成同一目标置信度变化的问题,设计帧间目标回归网络,利用帧间运动连续性融合相邻多帧的目标特征,并与当前帧目标特征进行匹配回归输出预测结果;最后利用单帧检测结果修正,实现检测性能的提升。通过对已有无人机数据集进行筛选、融合和补充标注,构建一个更全面的无人机视频车辆数据集。该方法在数据集上的平均精度较单阶段全卷积目标检测和基于光流引导特征融合的视频目标检测分别提高约2%和5%,可达47.42%。实验结果表明,该方法优于单阶段全卷积目标检测和基于光流引导特征融合的视频目标检测等视频目标检测算法,具有更好的鲁棒性和泛化性。
- 单位