为解决双臂冗余机器人的非操作臂因不在规划范围内所导致的非操作臂占据操作空间的问题,提出了基于任务空间关节距离离线数据集的深度确定性策略梯度(D-DDPG)主动自避碰策略.通过构建关节间距离的描述数据集,结合DDPG深度强化学习生成主动避碰模型,利用经验模型主动驱动非操作臂运动到非任务空间,在避免操作臂路径规划中避障运算的同时,为操作臂提前避让出一定的操作空间.实验表明:D-DDPG策略在连续路径避障测试中可将最小关节距离提升到初始位置的2.38倍.