一种基于深度强化学习实现的装箱方法

作者:吕长虹; 张小锐; 杨立光; 王晓辉; 来蕾
来源:2020-06-16, 中国, CN202010545595.4.

摘要

本发明公开了一种基于深度强化学习实现的装箱方法,包括以下步骤:获取需要装箱的区域和各矩形箱体信息;根据区域和各矩形箱体信息通过深度强化学习返回装箱策略;根据返回的装箱策略结合矩形带排样算法对各矩形箱体进行装箱;基于线下训练、线上运行,因此对于二维矩形条装箱问题的每个实例不需要重新执行算法,只需通过线下训练所得模型简单运算。在求解大规模的二维矩形条装箱问题时,在装箱策略普遍优于或近似于启发式搜索算法的同时,本发明所述的装箱方法的线上运行速度显著优于启发式搜索算法。