摘要
动态改变机械臂的既定规划对提高气振盘式播种流水线的工作效率具有重要意义。根据现有气振盘式播种流水线的工作特点,提出一种基于深度强化学习的气振盘式播种机械臂运动规划方法。利用感知行动空间建立马尔可夫模型,结合吸种盘位姿及目标动作状态,设计一种基于过程动作的奖励函数,引导吸种盘携种至流水线上方区域配合育秧盘进行跟随排种。利用V-REP对播种环境参数进行重构,建立机械臂动作集强化学习框架,证明改进近端策略优化算法可有效加快收敛速度。仿真试验表明:吸种盘在X,Y,Z轴上的位置误差绝对值小于2.5,3.0,1.1 mm,各轴上偏转角误差绝对值小于1.20°,1.14°,1.28°,最大距离误差为4.5 mm,平均播种周期约为5.1 s。该方法各项指标均达到设计要求,可为提高气振盘式播种流水线工作效率提供依据。
- 单位