摘要

配电架空线路很多建设在环境恶劣、地形复杂的区域,当其上有冰雪、污物或者异物时,极易引发线路故障。考虑到电力维护人员的工作效率和安全,解决线路自动化清洗问题,提出一种基于深度强化学习的自动化清洗机器人路径规划方法。首先基于深度强化学习,结合碰撞约束与目标约束建立了清洗路径的规划模型,同时对到达目标位置和深度清洗关键部位予以智能体奖励。然后针对深度强化学习进行Actor-Critic优化,Actor依据概率采取相应的动作,引发的奖励反馈回Critic; Critic通过动作情况与反馈对比,来确定后续动作。最后,引入长短期网络对历史数据及不同维度的数据进行处理,采用强化学习中的A3C方法对路径进行选择和判别,采取多线程的强化学习方法,多个智能体并行完成路径规划并清洗。基于Gazebo平台进行仿真,结果表明,所提方法将清洗时间缩短至少15%,并显著提升了清洗机器人的运行效率。