针对非结构化自然环境使基于深度强化学习的采摘轨迹规划训练效率低的问题,提出了基于分步迁移策略的深度确定性策略梯度算法(DDPG)并进行了苹果采摘轨迹规划。首先提出了基于DDPG的渐进空间约束分步训练策略;其次利用迁移学习思想将轨迹规划的最优策略由无障碍场景迁移到单一障碍场景、由单一障碍场景迁移到混杂障碍场景;最后对多自由度苹果采摘机械臂进行了采摘轨迹规划仿真实验,结果表明,分步迁移策略能够提高DDPG算法的训练效率与网络性能,仿真实验验证了本文方法的有效性。