本发明公开了一种基于深度强化学习实现的装箱方法,包括以下步骤:获取需要装箱的区域和各矩形箱体信息;根据区域和各矩形箱体信息通过深度强化学习返回装箱策略;根据返回的装箱策略结合矩形带排样算法对各矩形箱体进行装箱;基于线下训练、线上运行,因此对于二维矩形条装箱问题的每个实例不需要重新执行算法,只需通过线下训练所得模型简单运算。在求解大规模的二维矩形条装箱问题时,在装箱策略普遍优于或近似于启发式搜索算法的同时,本发明所述的装箱方法的线上运行速度显著优于启发式搜索算法。