摘要
现阶段多场景下的行人检测模型存在的主要问题在于训练数据样本多样性不足,在开放的测试环境下效果较差,不同场景之间存在数据鸿沟。针对上述问题,提出了一种基于马赛克自编码器(MAE)的多场景行人检测优化方法。首先,采用随机生成方法对原始训练数据进行自动扩充;然后,围绕数据、模型和结果等重要影响因素,分别对检测模型训练前中后三个阶段进行优化;最后,实现从通用大模型到专用小任务的自适应迁移。实验结果表明,在不增加额外标注数据的情况下,在多个公开数据集之间进行场景迁移,以常用的Caltech Pedestrian作为目标数据集,与当前最优结果 Pedestron方法对比,在Reasonable、Small和Heavy子数据集上的每张图片误检率(FPPI)分别下降0.4个百分点、0.7个百分点和2.6个百分点,从而验证了模型泛化性的显著提升;另一方面,针对实际应用构建多场景行人检测数据集,验证集的平均准确率(AP)提升1.9个百分点,进一步验证MAE生成数据对模型准确性的提升作用。
-
单位公安部第三研究所物联网技术研发中心