基于强化学习的生产再决策问题

作者:夏金; 孙宏波; 孙立民*
来源:计算机集成制造系统, 2019, 25(11): 2935-2942.
DOI:10.13196/j.cims.2019.11.022

摘要

为解决制造型企业面临的订单变更后生产再决策问题,提出一种基于强化学习的生产再决策方案。对订单变更问题使用半马尔可夫决策模型建模,综合考虑企业实际生产环节中的设备使用情况、产品的收益、库存开销以及订单的违约赔偿等因素,将企业收益最大化和变更前后整体生产决策差异最小化作为优化目标,采用动态改变探索速率和学习速率的Q-learning算法对生产再决策问题进行优化。数值实验证明,所提方法可以快速解决生产再决策问题。