本发明提供一种车间调度方法、装置、电子设备及存储介质,车间调度方法包括:获取车间的生产状态参数,并基于所述生产状态参数,得到状态特征矩阵;将所述状态特征矩阵输入至在线策略网络,得到当前时刻的状态动作价值;基于所述当前时刻的状态动作价值,以及目标调度规则库,得到当前时刻的最优调度规则;基于所述当前时刻的最优调度规则,执行车间调度指令。本发明提供的车间调度方法可以解决现有技术中单一调度规则的缺陷,实现利用多个调度规则执行车间调度,以适应调度场景的变化,满足多调度场景的优化。