摘要
为实现自然环境下苹果幼果的快速准确检测,针对幼果期苹果果色与叶片颜色高度相似、体积微小、分布密集,识别难度大的问题,提出了一种融合高效通道注意力(Efficient channel attention, ECA)机制的改进YOLO v7模型(YOLO v7-ECA)。在模型的3条重参数化路径中插入ECA机制,可在不降低通道维数的前提下实现相邻通道局部跨通道交互,有效强调苹果幼果重要信息、抑制冗余无用特征,提高模型效率。采集自然环境下苹果幼果图像2 557幅作为训练样本、547幅作为验证样本、550幅作为测试样本,输入模型进行训练测试。结果表明,YOLO v7-ECA网络模型准确率为97.2%、召回率为93.6%、平均精度均值(Mean average precision, mAP)为98.2%、F1值为95.37%。与Faster R-CNN、SSD、Scaled-YOLO v4、YOLO v5、YOLO v6、YOLO v7网络模型相比,其mAP分别提高15.5、4.6、1.6、1.8、3.0、1.8个百分点,准确率分别提高49.7、0.9、18.5、1.2、0.9、1.0个百分点,F1值分别提高33.53、2.81、9.16、1.26、2.38、1.43个百分点,召回率相较于Faster R-CNN、SSD、YOLO v5、YOLO v6、YOLO v7网络模型分别提高5.0、4.5、1.3、3.7、1.8个百分点;单幅图像检测时间为28.9 ms,可实现苹果幼果的高效检测。针对幼果目标模糊、存在阴影和严重遮挡的情况,本研究采用550幅测试图像进行模型鲁棒性检验。在加噪模糊情况下,YOLO v7-ECA的mAP为91.1%,F1值为89.8%,与Faster R-CNN、SSD、Scaled-YOLO v4、YOLO v5、YOLO v6、YOLO v7网络模型相比其mAP分别提高26.3、21.0、5.4、8.0、11.5、8.9个百分点,F1值分别提高27.19、7.08、8.50、4.20、3.94、4.67个百分点;在阴影情况下,YOLO v7-ECA的mAP为97.5%,F1值为95.36%,与Faster R-CNN、SSD、Scaled-YOLO v4、YOLO v5、YOLO v6、YOLO v7网络模型相比其mAP分别提高14.8、8.8、2.1、2.4、5.4、2.5个百分点,F1值分别提高21.51、2.60、10.49、1.53、3.23、2.56个百分点;在严重遮挡情况下,YOLO v7-ECA的mAP为98.6%,F1值为94.8%,与Faster R-CNN、SSD、Scaled-YOLO v4、YOLO v5、YOLO v6、YOLO v7网络模型相比其mAP分别提高21.7、13.7、2.3、2.4、4.8、2.2个百分点,F1值分别提高28.29、3.50、6.45、0.96、1.36、1.36个百分点。该网络模型可在保证网络模型精度的同时拥有较快的检测速度,且对场景模糊、阴影和严重遮挡等影响具有较好的鲁棒性。该研究可为幼果实时检测系统提供有效借鉴。
-
单位西北农林科技大学; 电子工程学院