摘要
针对工业现场散乱堆叠、零件位姿难以准确检测的问题,提出一种基于改进YOLO6D的工业零件位姿检测算法。首先,对原始YOLO6D网络结构进行改进。以Darknet53作为主干网络,并在其残差块内部引入坐标注意力机制,强化神经网络对坐标信息的表达能力;利用空洞空间金字塔池化捕获多尺度上下文信息,实现底层坐标信息与高层语义信息的特征融合;采用Mish函数作为激活函数,增强神经网络的鲁棒性。在此基础上,采用改进YOLO6D网络检测工业零件6D位姿。以工业零件图像作为改进YOLO6D网络的输入,直接回归输出目标零件3D边界框的9个关键点,利用2D-3D空间中的映射关系,采用PnP算法计算目标零件的6D位姿。最后,进行工业零件位姿检测实验验证。实验结果表明,所提算法具有较高的准确性和鲁棒性,为三维空间内工业零件的位姿检测提供了一种有效的思路。
-
单位机电工程学院; 西安工程大学