摘要
当前,目标检测技术正逐步应用于农业,然而在农田害虫检测的运用中仍存在检测速度慢、检测准确率偏低的问题,且仅仅预测害虫的种类和位置信息不足以满足复杂的工程需求。本文提出一种可以额外预测害虫状态信息的融合MAE和YOLOX算法的高速高精度农田害虫检测模型MRA-YOLOX(MaskedAutoencodersAndRapidAimDetection-ExceedingYOLO)。算法通过构建近4万数量级的图片以及5万余标注的数据集TDBFP(TargetDetectionDataSetBeUsedForFarmlandPests),TDBFP数据集标注了10种害虫的生长状态,物种类别以及位置,以便更好的把握害虫的信息,从而更准确的制定对策;首先,修改YOLOX模型的解耦头及loss,额外输出生长状态,以改进模型预测更多信息;其次,将ECA和SA注意力机制进行有机融合,并插入backbone与FPN的连接过程以及FPN的通道堆叠过程,以便能够增强获得全局信息和丰富上下文信息的能力,从而取得比单一注意力机制更好的效果;最后,将MAE中自监督解码器部分插入YOLOX的数据增强部分,目的是扩大感受野,增强识别细粒度,获得超越mixup和mosaic的数据增强效果。实验结果表明,当需要同时感知目标的状态、分类和位置时,MRA-YOLOX相较于原始YOLOX 模型对于TDBFP数据集的检测精度mAP@0.5由60.1%上升到88.2%,平均检测准确率提高了18.8%,且检测帧率FPS达到145,可以用于更复杂的工程实践。
- 单位