摘要
为解决YOLO算法由于其端到端的网络结构导致某些尺度上的特征被淡化或丢失使识别率较低的问题,本文以葡萄为例,对可训练变换器和RdNet在果实识别网络中的应用进行研究。提出基于可训练变换器和多尺度特征图融合的改进YOLO算法,以自主设计的基于堆叠残差块和降采样块的RdNet作为特征提取网络,采用converter变换器结构进行不同尺度的特征变换融合,从采集并筛选的葡萄果园照片中,随机选取120张作为测试集,将其余照片进行数据增强,得到480张图片作为训练集,并分别对提出的模型、YOLOv3和快速区域提出卷积神经网络(faster region-convolutional neural networks,Faster R-CNN)三种算法进行训练,使用其在测试集上的F1值与AP值评估各模型的性能差异。实验结果表明,模型在测试集上的F1值可达92.58%,AP值可达92.33%,而在Nvidia Jetson TX2平台上,检测速度达到19f/s,单张640×480图片的推理时间为52.6ms,达到了较理想的识别准确率,且能满足采摘机器人的实时性要求。该研究在果园等场景中可以得到更好的应用效果。
-
单位机电工程学院; 青岛大学