摘要
针对现阶段绞吸船疏浚控制系统需要智能优化疏浚生产效率的需求,提出了一种基于强化学习的绞吸挖泥船施工参数智能自主寻优方法,首先采用信息增益率的方法挑选施工过程的控制变量,组成多元的训练数据组,然后搭建包含连续动作空间、状态转移和奖惩函数的强化学习环境模型;智能体根据算法给出的随机动作执行指令并反馈状态信息,通过与环境的交互学习逐渐获得最优策略,实现绞吸船疏浚参数的自主寻优。利用实船采集的数据进行仿真实验,结果表明基于强化学习的疏浚参数自主寻优方法能在不确定环境条件下快速有效地学习和达到目标,证明了此方法的合理性和有效性。
-
单位中交疏浚技术装备国家工程研究中心有限公司