摘要
针对云制造环境下供应商加入退出、制造成本变动等因素导致的传统产品配置方法不适用的问题,提出了一种以全过程服务质量最大化为目标的产品配置建模方法,建立了适应动态变化的云制造环境的产品配置模型。文章将云制造产品配置问题视为马尔可夫决策过程,阐明了面向产品配置优化问题的智能体、环境、动作、奖励、转移等强化学习关键概念,设计了基于深度Q网络的产品配置优化求解算法。轮式装载机产品配置仿真实验表明,基于深度强化学习的云制造产品配置方法的模型全局奖励值接近且收敛于理论奖励值上限,很好地适应了云制造环境的动态变化特征。
-
单位福建船政交通职业学院; 福州大学