针对生鲜农产品多级库存成本控制问题,运用多智能强化学习思想,从供应链视角抽象出批发商与零售商智能体,引入三参数Weibull函数描述生鲜农产品的损腐特征,使用深度双Q网络算法构建基于多智能体的生鲜农产品多级库存成本控制模型。该模型基于智能体间相互合作,优化订货并控制多级库存成本。实验结果表明,基于多智能体的库存成本控制模型能够在一定程度上减轻供应链多级库存中的牛鞭效应,有效降低各级库存成本,减少生鲜损腐。