基于深度强化学习的作业车间调度问题优化

乔东平; 段绿旗<sup>*</sup>; 黎宏磊; 肖艳秋

doi:10.19287/j.mtmt.1005-2402.2023.04.023

摘要

针对作业车间调度问题求解的复杂性，以最小化最大完工时间为目标，提出基于深度强化学习优化算法求解作业车间调度问题。首先，基于析取图模型构建深度强化学习的调度环境，并建立三通道状态特征，设计20种复合启发式调度规则作为动作空间，将奖励函数等价为机器利用率；利用深度卷积神经网络搭建动作网络和目标网络，以状态作为输入，输出每个动作的Q值，进而使用行动有效性探索和利用策略选取动作；最后，计算即时奖励和更新调度环境。使用标准案例验证了算法可以平衡求解质量和时间，训练好的智能体对非零初始状态下调度问题具有很好的泛化性。

单位
郑州轻工业大学

全文

访问全文

收藏分享被引浏览

更新时间：2024-03-15 18:54

基于深度强化学习的作业车间调度问题优化

摘要

全文

产品服务

站内浏览

服务支持

联系方式

科研之友