摘要
节能减排对于实现可持续发展具有重要意义。本文考虑了动态扰动事件对生产的影响,研究了可重入混合流水车间绿色动态调度问题,提出了改进的Q学习算法。在可重入混合流水车间中,将各个加工阶段抽象为智能体,搭建了多智能体强化学习模型。选用均值漂移算法对历史状态进行聚类。为实现全局优化,设计了经验共享策略实现各个智能体之间的经验交互,并设计了自适应贪婪策略选取动作。最后进行了数值实验,实验结果表明,在求解可重入混合流水车间绿色动态调度问题时,改进的Q学习算法优于单一的调度规则,可以在提高生产效率的同时保证较低的能耗,并且能够对实际生产环境中的动态扰动因素快速做出反应,能够有效地解决实际问题。
- 单位