摘要
本发明属于生产制造调度领域,公开了一种基于深度强化学习和遗传算法的分批调度优化方法,包括步骤:建立差异工件批调度问题的数学模型;采用指针网络建立该问题的策略模型;利用actor-critic算法训练指针网络模型;定义并初始化遗传算法的参数;使用训练完成的指针网络优化遗传算法的初始种群;采用遗传算法对调度方案进行进一步优化;利用遗传算法得到的最优方案作为批处理机加工工件的生产方案。本发明中的指针网络相较于传统的启发式算法,可以获得更优的解;并且在遗传算法的交叉操作中,提出了一种新型的交叉方式,可以在指针网络所得调度方案的基础上,利用提高遗传算法的寻优能力,进一步提升方案的性能。
- 单位